Kemungkinan
Masalah umum dalam teori probabilitas merujuk pada probabilitas pengamatan diberikan model tertentu dan diberikan parameter (sebut saja ) yang terlibat. Misalnya probabilitas untuk situasi tertentu dalam permainan kartu atau permainan dadu seringkali sangat mudah.x1,x2,...,xnθ
Namun, dalam banyak situasi praktis kita berhadapan dengan situasi terbalik ( statistik inferensial ). Yaitu: pengamatan diberikan dan sekarang model tidak diketahui , atau setidaknya kita tidak tahu parameter tertentu .x1,x2,...,xk θθ
Dalam jenis masalah ini kita sering merujuk pada istilah yang disebut kemungkinan parameter, , yang merupakan tingkat kepercayaan pada parameter tertentu diberikan pengamatan . Istilah ini dinyatakan proporsional dengan probabilitas untuk pengamatan dengan asumsi bahwa parameter model akan benar secara hipotesis. L(θ)θx1,x2,..xkx1,x2,..xkθL(θ,x1,x2,..xk)∝probability observations x1,x2,..xk given θ
Untuk nilai parameter yang diberikan semakin besar kemungkinan observasi tertentu adalah (relatif terhadap probabilitas dengan nilai parameter lainnya), semakin banyak pengamatan mendukung parameter khusus ini (atau teori / hipotesis yang mengasumsikan parameter ini) . Kemungkinan tinggi (relatif) akan memperkuat keyakinan kami tentang nilai parameter tersebut (ada banyak hal yang lebih filosofis untuk dikatakan tentang ini).θx1,x2,..xn
Kemungkinan masalah tangki Jerman
Sekarang untuk masalah tank Jerman fungsi kemungkinan untuk sekumpulan sampel adalah:x1,x2,..xk
L(θ,x1,x2,..xk)=Pr(x1,x2,..xk,θ)={0(θk)−1if max(x1,x2,..xk)>θif max(x1,x2,..xk)≤θ,
Apakah Anda mengamati sampel {1, 2, 10} atau sampel {8, 9, 10} tidak masalah ketika sampel dipertimbangkan dari distribusi yang seragam dengan parameter . Kedua sampel memiliki kemungkinan yang sama dengan probabilitas dan menggunakan gagasan kemungkinan satu sampel tidak memberi tahu lebih banyak tentang parameter daripada sampel lainnya.θ(θ3)−1θ
Nilai tinggi {8, 9, 10} mungkin membuat Anda berpikir / percaya bahwa harus lebih tinggi. Tetapi, hanya nilai {10} Yang benar-benar memberi Anda informasi yang relevan tentang kemungkinan (nilai 10 memberi tahu Anda bahwa akan sepuluh atau lebih tinggi, nilai-nilai lain 8 dan 9 tidak berkontribusi apa pun pada informasi ini. ).θθ θθθ
Teorisasi faktorisasi Fisher Neyman
Teorema ini memberi tahu Anda bahwa statistik tertentu (yaitu beberapa fungsi pengamatan, seperti rata-rata, median, atau seperti dalam masalah tank Jerman maksimum) cukup (berisi semua informasi) ketika Anda dapat memfaktorkan keluar, dalam fungsi kemungkinan, istilah yang bergantung pada pengamatan lain , sehingga faktor ini tidak bergantung pada parameter dan (dan bagian dari fungsi kemungkinan yang menghubungkan data dengan nilai parameter hipotetis hanya tergantung pada statistik tetapi tidak keseluruhan data / pengamatan).T(x1,x2,…,xk)x1,x2,…,xkθx1,x2,…,xk
Kasus tangki Jerman sederhana. Anda dapat melihat di atas bahwa seluruh ekspresi untuk Kemungkinan di atas sudah hanya bergantung pada statistik dan sisa dari nilai tidak masalah.max(x1,x2,..xk)x1,x2,..xk
Game kecil sebagai contoh
Katakanlah kita memainkan game berikut berulang kali: itu sendiri adalah variabel acak dan digambar dengan probabilitas yang sama baik 100 atau 110. Kemudian kita menggambar sampel .θx1,x2,...,xk
Kami ingin memilih strategi untuk menebak , berdasarkan pengamatan yang memaksimalkan peluang kami untuk mendapatkan tebakan .θx1,x2,...,xkθ
Strategi yang tepat adalah memilih 100 kecuali salah satu angka dalam sampel adalah> 100.
Kita bisa tergoda untuk memilih nilai parameter 110 sudah ketika banyak dari cenderung semua nilai tinggi mendekati seratus (tetapi tidak ada yang persis lebih dari seratus), tetapi itu akan salah. Probabilitas untuk pengamatan semacam itu akan lebih besar ketika nilai parameter yang sebenarnya adalah 100 daripada ketika itu adalah 110. Jadi jika kita menebak, dalam situasi seperti itu, 100 sebagai nilai parameter, maka kita akan cenderung membuat kesalahan (karena situasi dengan nilai-nilai tinggi ini mendekati seratus, namun masih di bawahnya, lebih sering terjadi dalam kasus bahwa nilai sebenarnya adalah 100 daripada kasus bahwa nilai sebenarnya adalah 110).x1,x2,...,xk