Apa alasan bahwa fungsi kemungkinan bukan pdf (probabilitas kepadatan fungsi)?
Apa alasan bahwa fungsi kemungkinan bukan pdf (probabilitas kepadatan fungsi)?
Jawaban:
Kami akan mulai dengan dua definisi:
Fungsi probabilitas kerapatan (pdf) adalah fungsi non-negatif yang berintegrasi ke .
Kemungkinan didefinisikan sebagai kepadatan bersama dari data yang diamati sebagai fungsi dari parameter. Tetapi, seperti yang ditunjukkan oleh referensi ke Lehmann yang dibuat oleh @whuber dalam komentar di bawah ini, fungsi kemungkinan adalah fungsi dari parameter saja, dengan data yang disimpan sebagai konstanta tetap. Jadi fakta bahwa itu adalah kepadatan sebagai fungsi data tidak relevan.
Oleh karena itu, fungsi kemungkinan bukan pdf karena integral dengan parameter tidak harus sama dengan 1 (dan mungkin tidak dapat diintegrasikan sama sekali, sebenarnya, sebagaimana ditunjukkan oleh komentar lain dari @whuber).
Untuk melihat ini, kami akan menggunakan contoh sederhana. Misalkan Anda memiliki pengamatan tunggal, , dari B e r n o u l l i ( θ ) distribusi. Maka fungsi kemungkinannya adalah
Ini adalah fakta bahwa . Secara khusus, jika x = 1 , maka L ( θ ) = θ , sehingga ∫ 1 0 L ( θ ) d θ = ∫ 1 0 θ d θ = 1 / 2
dan perhitungan yang sama berlaku ketika . Oleh karena itu, L ( θ ) tidak dapat menjadi fungsi kerapatan.
Mungkin bahkan lebih penting daripada contoh teknis ini menunjukkan mengapa kemungkinan bukan kepadatan probabilitas adalah untuk menunjukkan bahwa kemungkinan bukan probabilitas dari nilai parameter yang benar atau semacamnya - itu adalah probabilitas (kepadatan) dari data diberikan nilai parameter , yang merupakan hal yang sangat berbeda. Oleh karena itu, seseorang seharusnya tidak mengharapkan fungsi kemungkinan berperilaku seperti kepadatan probabilitas.
Saya bukan ahli statistik, tetapi pemahaman saya adalah bahwa sementara fungsi kemungkinan itu sendiri bukan PDF berkenaan dengan parameter (s), itu terkait langsung dengan PDF oleh Bayes Rule. Fungsi kemungkinan, P (X | theta), dan distribusi posterior, f (theta | X), terkait erat; sama sekali bukan "hal yang sama sekali berbeda".
Mari kita lihat bentuk aslinya:
Sebagai contoh, saya tidak tahu varian rata-rata dan standar dari suatu distribusi Gaussian dan ingin mendapatkannya dengan pelatihan menggunakan banyak sampel dari distribusi tersebut. Saya pertama-tama menginisialisasi varians rata-rata dan standar secara acak (yang mendefinisikan distribusi Gaussian), dan kemudian saya mengambil satu sampel dan masuk ke dalam estimasi distribusi dan saya bisa mendapatkan probabilitas dari distribusi yang diestimasi. Kemudian saya terus memasukkan sampel dan mendapatkan banyak probabilitas dan kemudian saya gandakan probabilitas ini dan mendapatkan skor. Skor semacam ini adalah kemungkinannya. Hampir tidak bisa itu menjadi probabilitas pdf tertentu.