Trinitas tes dalam kemungkinan maksimum: apa yang harus dilakukan ketika dihadapkan dengan kesimpulan yang bertentangan?


10

Tes Wald, Likelihood Ratio dan Lagrange Multiplier dalam konteks estimasi kemungkinan maksimum adalah setara secara asimptotik. Namun, untuk sampel kecil, mereka cenderung menyimpang sedikit, dan dalam beberapa kasus mereka menghasilkan kesimpulan yang berbeda.

Bagaimana mereka dapat diurutkan berdasarkan seberapa besar kemungkinan mereka menolak nol? Apa yang harus dilakukan ketika tes memiliki jawaban yang bertentangan? Bisakah Anda memilih yang memberikan jawaban yang Anda inginkan atau apakah ada "aturan" atau "pedoman" tentang bagaimana untuk melanjutkan?


Apakah ini, mungkin, hanya kasus di mana perkiraan asimtotik terhadap distribusi [nol] dari satu atau lebih dari tiga statistik uji tidak begitu baik? mungkin hasilnya berbeda karena ukuran sebenarnya dari tes berbeda? seberapa besar ukuran sampel Anda?
ronaf

Jawaban:


5

Saya tidak tahu literatur di daerah itu cukup baik untuk menawarkan tanggapan langsung. Namun, menurut saya jika ketiga tes berbeda maka itu merupakan indikasi bahwa Anda memerlukan penelitian / pengumpulan data lebih lanjut untuk menjawab pertanyaan Anda secara definitif.

Anda juga mungkin ingin melihat ini pencarian Google Scholar

Perbarui dalam menanggapi komentar Anda:

Jika pengumpulan data tambahan tidak memungkinkan maka ada satu solusi. Lakukan simulasi yang mencerminkan struktur data Anda, ukuran sampel dan model yang Anda usulkan. Anda dapat mengatur parameter ke beberapa nilai yang ditentukan sebelumnya. Perkirakan model menggunakan data yang dihasilkan dan kemudian periksa salah satu dari tiga tes yang menunjukkan Anda ke model yang tepat. Simulasi semacam itu akan menawarkan beberapa panduan tes yang digunakan untuk data Anda yang sebenarnya. Apakah itu masuk akal?


1
Apakah Anda mengacu pada makalah tertentu? Saya membayangkan saya dapat menemukan jawaban untuk pertanyaan saya jika saya meneliti, mempelajari, membaca banyak, tetapi demikian juga 95% dari pertanyaan yang diajukan orang lain di sini ... Juga, dalam beberapa kasus, terutama dengan data ekonomi makro (yang merupakan area saya ), tidak ada lagi data yang harus dikumpulkan. Data langka (jumlah pengamatan, maksud saya), dan Anda hanya harus hidup dengannya. Tidak ada solusi "dapatkan lebih banyak data". Saya berharap seseorang di sini akan tahu topiknya, tetapi sepertinya tidak. Mungkin begitu situs web dibuka untuk masyarakat umum?
Vivi

Saya menduga jawaban untuk pertanyaan Anda akan spesifik untuk domain / model dan karenanya saya tidak yakin dapat merekomendasikan makalah tertentu.

1
Maaf atas jawaban yang terlambat. Saya suka saran Anda tentang simulasi. Tapi itu tidak mudah. Yang benar adalah, apa yang saya lihat dalam praktik adalah bahwa para peneliti hanya melakukan tes yang lebih mudah secara komputasi atau yang memberi mereka hasil yang mereka inginkan.
Vivi

8

Saya tidak akan memberikan jawaban yang pasti dalam hal peringkat ketiganya. Bangun 95% CI di sekitar parameter Anda berdasarkan masing-masing, dan jika mereka sangat berbeda, maka langkah pertama Anda harus menggali lebih dalam. Ubah data Anda (meskipun LR akan invarian), atur kemungkinan Anda, dll. Namun, saya mungkin akan memilih tes LR dan CI terkait. Argumen kasar berikut.

LR invarian di bawah pilihan parametrization (misalnya T versus logit (T)). Statistik Wald mengasumsikan normalitas (T - T0) / SE (T). Jika ini gagal, CI Anda buruk. Yang menyenangkan tentang LR adalah Anda tidak perlu menemukan transformasi f (T) untuk memenuhi normalitas. CI 95% berdasarkan T akan sama. Juga, jika kemungkinan Anda tidak kuadratik, Wald 95% CI, yang simetris, dapat menjadi kooky karena mungkin lebih suka nilai-nilai dengan kemungkinan lebih rendah daripada yang memiliki kemungkinan lebih tinggi.

Cara lain untuk berpikir tentang LR adalah menggunakan lebih banyak informasi, secara longgar, dari fungsi kemungkinan. Wald didasarkan pada MLE dan kelengkungan dari kemungkinan nol. Skor didasarkan pada kemiringan nol dan kelengkungan nol. LR mengevaluasi kemungkinan di bawah nol, dan kemungkinan di bawah gabungan dari nol dan alternatif, dan menggabungkan keduanya. Jika Anda terpaksa memilih satu, ini mungkin secara intuitif memuaskan untuk memilih LR.

Perlu diingat bahwa ada alasan lain, seperti kenyamanan atau komputasi, untuk memilih Wald atau Score. Wald adalah yang paling sederhana dan, diberi parameter multivariat, jika Anda menguji untuk menetapkan banyak individu menjadi 0, ada cara mudah untuk memperkirakan kemungkinan. Atau jika Anda ingin menambahkan variabel pada satu waktu dari beberapa set, Anda mungkin tidak ingin memaksimalkan kemungkinan untuk setiap model baru, dan implementasi tes Skor menawarkan kenyamanan di sini. Wald dan Score menjadi menarik ketika model dan kemungkinan Anda menjadi tidak menarik. (Tapi saya tidak berpikir ini yang Anda tanyakan, karena Anda memiliki ketiganya tersedia ...)

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.