Kesan yang saya dapat, berdasarkan beberapa makalah, buku, dan artikel yang saya baca, adalah cara yang disarankan untuk menyesuaikan distribusi probabilitas pada set data adalah dengan menggunakan estimasi kemungkinan maksimum (MLE). Namun, sebagai seorang fisikawan, cara yang lebih intuitif adalah dengan menyesuaikan pdf model dengan pdf empiris data menggunakan kuadrat terkecil. Lalu mengapa MLE lebih baik daripada kuadrat terkecil dalam distribusi probabilitas pas? Dapatkah seseorang tolong tunjukkan saya pada makalah / buku ilmiah yang menjawab pertanyaan ini?
Firasat saya adalah karena MLE tidak menganggap model noise dan "noise" di pdf empiris heteroscedastic dan tidak normal.