Operasi-operasi ini dilakukan berdasarkan kemungkinan daripada probabilitas. Meskipun perbedaannya mungkin halus, Anda mengidentifikasi aspek krusial darinya: produk dari dua kepadatan tidak pernah menjadi kepadatan.
Bahasa di blog mengisyaratkan ini - tetapi pada saat yang sama membuatnya salah - jadi mari kita menganalisisnya:
Rata-rata distribusi ini adalah konfigurasi yang kemungkinan besar kedua perkiraannya, dan karenanya merupakan tebakan terbaik dari konfigurasi sebenarnya mengingat semua informasi yang kami miliki.
Kami telah mengamati bahwa produk tersebut bukan distribusi. (Meskipun bisa diubah menjadi satu melalui perkalian dengan nomor yang sesuai, bukan itu yang terjadi di sini.)
Kata-kata "perkiraan" dan "tebakan terbaik" menunjukkan bahwa mesin ini digunakan untuk memperkirakan parameter - dalam hal ini, "konfigurasi sebenarnya" (koordinat x, y).
Sayangnya, rata-rata adalah tidak perkiraan terbaik. The modus ini. Ini adalah Prinsip Maximum Likelihood (ML).
Agar penjelasan blog masuk akal, kita harus menganggap yang berikut ini. Pertama, ada lokasi yang benar dan pasti. Sebut saja secara abstrak . Kedua, setiap "sensor" tidak melaporkan . Sebaliknya itu melaporkan nilai yang mungkin dekat dengan . Sensor "Gaussian" memberikan kepadatan probabilitas untuk distribusi . Agar sangat jelas, kepadatan untuk sensor adalah fungsi , tergantung pada , dengan properti yang untuk setiap wilayah (dalam pesawat), kemungkinan sensor akan melaporkan nilai dalam adalahμμXsayaμXsayasayafsayaμRR
Pr (Xsaya∈ R ) =∫Rfsaya( x ; μ ) dx .
Ketiga, kedua sensor diasumsikan beroperasi dengan kemandirian fisik , yang diambil untuk menyiratkan kemandirian statistik .
Menurut definisi, kemungkinan dari dua pengamatan adalah kepadatan probabilitas yang akan mereka miliki di bawah distribusi bersama ini, mengingat lokasi sebenarnya adalah . Asumsi independensi menyiratkan bahwa itu adalah produk dari kepadatan. Untuk memperjelas titik halus,x1,x2μ
Fungsi produk yang ditunjuk untuk observasi adalah tidak kepadatan probabilitas untuk ; namun,f1( x ; μ )f2( x ; μ )xx
Produk adalah densitas gabungan untuk pasangan yang dipesan .f1(x1;μ)f2(x2;μ)(x1,x2)
Dalam gambar yang diposting, adalah pusat dari satu gumpalan, adalah pusat dari yang lain, dan titik-titik dalam ruangnya mewakili nilai yang mungkin dari . Perhatikan bahwa baik maupun tidak bermaksud mengatakan apa pun tentang probabilitas ! hanyalah nilai tetap yang tidak diketahui . Itu bukan variabel acak.x1x2μf1f2μμ
Berikut ini adalah sentuhan halus lainnya: kemungkinan dianggap sebagai fungsi . Kami memiliki data - kami berada hanya mencoba untuk mencari tahu apa mungkin akan. Jadi, apa yang kita perlu rencanakan adalah fungsi kemungkinanμμ
Λ(μ)=f1(x1;μ)f2(x2;μ).
Ini adalah kebetulan tunggal bahwa ini juga kebetulan seorang Gaussian! Demonstrasi terbuka. Mari kita lakukan perhitungan matematika hanya dalam satu dimensi (bukan dua atau lebih) untuk melihat polanya - semuanya digeneralisasikan ke lebih banyak dimensi. Logaritma seorang Gaussian memiliki bentuk
logfi(xi;μ)=Ai−Bi(xi−μ)2
untuk konstanta dan . Jadi kemungkinan log adalahAiBi
logΛ(μ)=A1−B1(x1−μ)2+A2−B2(x2−μ)2=C−(B1+B2)(μ−B1x1+B2x2B1+B2)2
di mana tidak bergantung pada . Ini adalah log dari Gaussian di mana peran telah digantikan oleh rata-rata tertimbang yang ditunjukkan pada fraksi.Cμxi
Mari kita kembali ke utas utama. Perkiraan ML adalah nilai yang memaksimalkan kemungkinan. Secara setara, ini memaksimalkan Gaussian yang baru saja kita peroleh dari produk Gaussians. Menurut definisi, maksimum adalah mode . Ini adalah kebetulan - yang dihasilkan dari titik simetri dari masing-masing Gaussian di sekitar pusatnya - bahwa mode terjadi bertepatan dengan mean.μ
Analisis ini telah mengungkapkan bahwa beberapa kebetulan dalam situasi tertentu telah mengaburkan konsep yang mendasarinya:
distribusi multivariat (gabungan) dengan mudah dikacaukan dengan distribusi univariat (yang bukan);
kemungkinannya tampak seperti distribusi probabilitas (yang bukan);
produk dari Gaussians adalah Gaussian (keteraturan yang umumnya tidak benar ketika sensor bervariasi dalam cara non-Gaussian);
dan mode mereka terjadi bertepatan dengan rata-rata mereka (yang dijamin hanya untuk sensor dengan respons simetris di sekitar nilai sebenarnya).
Hanya dengan berfokus pada konsep-konsep ini dan melepaskan perilaku-perilaku kebetulan kita dapat melihat apa yang sebenarnya terjadi.