RV Foutz dan RC Srivastava telah memeriksa masalah ini secara rinci. Makalah 1977 mereka "Kinerja uji rasio kemungkinan ketika model tidak benar" berisi pernyataan hasil distribusi dalam kasus kesalahan spesifikasi di samping sketsa bukti yang sangat singkat, sedangkan makalah mereka 1978 " Makalah asimtotik dari rasio kemungkinan ketika modelnya salah " berisi buktinya - tetapi yang terakhir diketikkan dengan tipe penulis lama (kedua makalah tersebut menggunakan notasi yang sama, sehingga Anda dapat menggabungkannya dalam membaca). Juga, untuk beberapa langkah pembuktian mereka merujuk pada sebuah makalah oleh KP Roy "Sebuah catatan tentang distribusi asimtotik rasio kemungkinan" dari tahun 1957 yang tampaknya tidak tersedia secara online, bahkan terjaga keamanannya.
Dalam hal kesalahan spesifikasi distribusi, jika MLE masih konsisten dan asimptotik normal (yang tidak selalu terjadi), statistik LR mengikuti secara asimptotik kombinasi linear chi-square independen (masing-masing satu derajat kebebasan)
- 2 lnλ →d∑i = 1rcsayaχ2saya
dimana . Kita dapat melihat "kesamaan": alih-alih satu chi-square dengan h - m derajat kebebasan, kita memiliki h - m chi-square masing-masing dengan satu derajat kebebasan. Tetapi "analogi" berhenti di situ, karena kombinasi linear chi-square tidak memiliki kepadatan bentuk tertutup. Setiap chi-square yang diskalakan adalah gamma, tetapi dengan parameter c i berbeda yang mengarah ke parameter skala berbeda untuk gamma -dan jumlah gammas tersebut bukan bentuk-tertutup, walaupun nilainya dapat dihitung.r = h - mh - mh - mcsaya
Untuk konstanta , kita memiliki c 1 ≥ c 2 ≥ . . . c r ≥ 0 , dan mereka adalah nilai eigen dari sebuah matriks ... matriks mana? Nah, menggunakan notasi penulis, atur Λ menjadi Hessian dari log-likelihood dan C menjadi produk luar dari gradien log-likelihood (dalam istilah harapan). Jadi V = Λ - 1 C ( Λ ′ ) - 1 adalah matriks varians-kovarians asimptotik dari MLE.cic1≥c2≥...cr≥0ΛCV=Λ−1C(Λ′)−1
Kemudian mengatur menjadi r × r atas blok diagonal V . Mr×rV
Juga tulis dalam bentuk blokΛ
Λ=[Λr×rΛ2Λ′2Λ3]
dan atur ( W adalah negatif dari Komplemen Schur dari Λ ).W=−Λr×r+Λ′2Λ−13Λ2WΛ
Maka adalah nilai eigen dari matriks M W yang dievaluasi pada nilai sebenarnya dari parameter.ciMW
TAMBAHKAN
Menanggapi komentar OP yang sah dalam komentar (kadang-kadang, memang, pertanyaan menjadi batu loncatan untuk berbagi hasil yang lebih umum, dan diri mereka sendiri mungkin diabaikan dalam proses), di sini adalah bagaimana bukti Wilks berlangsung: Wilks mulai dengan gabungan distribusi MLE yang normal, dan hasil untuk memperoleh ekspresi fungsional dari Rasio Kemungkinan. Hingga dan termasuk persamaannya. , buktinya dapat bergerak maju bahkan jika kita berasumsi bahwa kita memiliki kesalahan spesifikasi distribusi: seperti yang dicatat OP, syarat-syarat matriks varians kovarians akan berbeda dalam skenario kesalahan spesifikasi, tetapi semua yang dilakukan Wilks adalah mengambil turunan, dan mengidentifikasi istilah yang dapat diabaikan secara asimptotik. Dan dia tiba di tempat. [ 9 ][9][9]di mana kita melihat bahwa statistik rasio kemungkinan, jika spesifikasinya benar, hanyalah jumlah dari kuadrat standar variabel acak normal, dan mereka didistribusikan sebagai satu chi-square dengan derajat kebebasan h - m : (notasi generik )h−mh−m
−2lnλ=∑i=1h−m(n−−√θ^i−θiσi)2→dχ2h−m
Tetapi jika kita memiliki kesalahan spesifikasi, maka istilah yang digunakan untuk skala MLE terpusat dan diperbesar tidak lagi istilah yang akan membuat varians dari setiap elemen sama untuk persatuan, dan mengubah setiap istilah menjadi rv standar normal dan jumlahnya menjadi chi-square.
Dan mereka tidak, karena istilah-istilah ini melibatkan nilai yangdiharapkandari turunan kedua dari kemungkinan log ... tetapi nilai yang diharapkan hanya dapat diambil sehubungan dengan distribusi yang sebenarnya, karena MLE adalah fungsi dari data dan data mengikuti distribusi sebenarnya, sedangkan turunan kedua dari log-likelihood dihitung berdasarkan asumsi kepadatan yang salah. n−−√(θ^−θ)
Jadi di bawah kesalahan spesifikasi kita memiliki sesuatu seperti
dan yang terbaik yang bisa kita lakukan adalah memanipulasinya
−2lnλ=∑i=1h−m(n−−√θ^i−θiai)2
−2lnλ=∑i=1h−mσ2ia2i(n−−√θ^i−θiσi)2=∑i=1h−mσ2ia2iχ21
yang merupakan jumlah dari skala chi-square rv, tidak lagi didistribusikan sebagai satu chi-square rv dengan derajat kebebasan . Referensi yang diberikan oleh OP memang merupakan paparan yang sangat jelas dari kasus yang lebih umum ini yang memasukkan hasil Wilks sebagai kasus khusus.h−m