Saya bertanya-tanya apakah estimasi kemungkinan maksimum pernah digunakan dalam statistik.
Pasti! Sebenarnya cukup banyak - tetapi tidak selalu.
Kami belajar konsep itu tetapi saya bertanya-tanya kapan itu benar-benar digunakan.
Ketika orang memiliki model distribusi parametrik, mereka cukup sering memilih untuk menggunakan estimasi kemungkinan maksimum. Ketika model sudah benar, ada sejumlah properti berguna dari penduga kemungkinan maksimum.
Sebagai contoh - penggunaan model linier umum cukup luas dan dalam hal itu parameter yang menggambarkan rata-rata diperkirakan dengan kemungkinan maksimum.
Dapat terjadi bahwa beberapa parameter diperkirakan dengan kemungkinan maksimum dan yang lainnya tidak. Sebagai contoh, pertimbangkan Poisson GLM yang overdispersi - parameter dispersi tidak akan diestimasi dengan kemungkinan maksimum, karena MLE tidak berguna dalam kasus tersebut.
Jika kita mengasumsikan distribusi data, kita menemukan dua parameter
Yah, kadang-kadang Anda mungkin memiliki dua, tetapi kadang-kadang Anda memiliki satu parameter, kadang tiga atau empat atau lebih.
satu untuk mean dan satu untuk varians,
Apakah Anda memikirkan model tertentu? Ini tidak selalu terjadi. Pertimbangkan memperkirakan parameter distribusi eksponensial atau distribusi Poisson, atau distribusi binomial. Dalam setiap kasus tersebut, ada satu parameter dan varians adalah fungsi dari parameter yang menggambarkan rata-rata.
Atau pertimbangkan distribusi gamma umum , yang memiliki tiga parameter. Atau distribusi beta empat parameter , yang memiliki (mungkin tidak mengejutkan) empat parameter. Perhatikan juga bahwa (tergantung pada parameterisasi tertentu) mean atau varians atau keduanya mungkin tidak diwakili oleh parameter tunggal tetapi oleh fungsi beberapa dari mereka.
Sebagai contoh, distribusi gamma, di mana ada tiga parameterisasi yang melihat penggunaan yang cukup umum - dua yang paling umum memiliki kedua mean dan varians yang berfungsi dari dua parameter.
Biasanya dalam model regresi atau GLM, atau model bertahan hidup (di antara banyak jenis model lainnya), model mungkin tergantung pada beberapa prediktor, dalam hal ini distribusi yang terkait dengan setiap pengamatan di bawah model mungkin memiliki salah satu parameter sendiri (atau bahkan beberapa parameter) yang terkait dengan banyak variabel prediktor ("variabel independen").