Premis: ini mungkin pertanyaan bodoh. Saya hanya tahu pernyataan tentang sifat asimptotik MLE, tetapi saya tidak pernah mempelajari buktinya. Jika saya melakukannya, mungkin saya tidak akan menanyakan pertanyaan-pertanyaan ini, atau saya mungkin saya akan menyadari pertanyaan-pertanyaan ini tidak masuk akal ... jadi tolong mudahkan saya :)
Saya sering melihat pernyataan yang mengatakan bahwa penduga MLE dari parameter model adalah asimtotik normal dan efisien. Pernyataan ini biasanya ditulis sebagai
N→∞ sebagai
di mana adalah jumlah sampel, adalah informasi Fisher dan adalah parameter (vektor) nilai sebenarnya . Sekarang, karena ada referensi ke model yang benar, apakah ini berarti bahwa hasilnya tidak akan berlaku jika model tersebut tidak benar?I θ 0
Contoh: misalkan saya memodelkan output daya dari turbin angin sebagai fungsi dari kecepatan angin ditambah aditif Gaussian noiseV
Saya tahu modelnya salah, paling tidak karena dua alasan: 1) benar-benar sebanding dengan kekuatan ketiga dan 2) kesalahannya tidak bersifat aditif, karena saya mengabaikan prediktor lain yang tidak berkorelasi dengan kecepatan angin (saya juga tahu bahwa harus 0 karena pada 0 kecepatan angin tidak ada daya yang dihasilkan, tapi itu tidak relevan di sini). Sekarang, misalkan saya memiliki basis data daya dan kecepatan angin tak terbatas dari turbin angin saya. Saya bisa menggambar sebanyak mungkin sampel yang saya inginkan, dengan ukuran berapa pun. Misalkan saya menggambar 1000 sampel, masing-masing berukuran 100, dan menghitung \ hat {\ boldsymbol {\ beta}} _ {100} , perkiraan MLE dari \ boldsymbol {\ beta} = (\ beta_0, \ beta_1, \ beta_2)V β 0(yang di bawah model saya hanya akan menjadi estimasi OLS). Karena itu saya memiliki 1000 sampel dari distribusi . Saya dapat mengulangi latihan dengan . Sebagai , haruskah distribusi cenderung normal asimptotik, dengan mean dan varians yang dinyatakan? Atau apakah fakta bahwa model yang salah membuat hasil ini salah?
Alasan saya bertanya adalah bahwa jarang (jika pernah) model "benar" dalam aplikasi. Jika sifat asimptotik MLE hilang ketika model tidak benar, maka mungkin masuk akal untuk menggunakan prinsip estimasi yang berbeda, yang walaupun kurang kuat dalam pengaturan di mana model itu benar, dapat berkinerja lebih baik daripada MLE dalam kasus lain.
EDIT : tercatat dalam komentar bahwa gagasan tentang model yang benar dapat menjadi masalah. Saya memiliki definisi berikut dalam pikiran: diberikan keluarga model ditunjukkan oleh vektor parameter , untuk setiap model dalam keluarga Anda selalu dapat menulis
dengan hanya mendefinisikan sebagai . Namun, secara umum kesalahan tidak akan ortogonal ke , memiliki rata-rata 0, dan itu tidak serta merta memiliki distribusi diasumsikan dalam derivasi model. Jika ada nilai sedemikian rupa sehingga memiliki dua properti ini, serta distribusi yang diasumsikan, saya akan mengatakan model itu benar. Saya pikir ini berkaitan langsung dengan mengatakan bahwa , karena istilah kesalahan dalam dekomposisi
memiliki dua properti yang disebutkan di atas.