Saya punya pertanyaan metodologis umum. Mungkin sudah dijawab sebelumnya, tetapi saya tidak dapat menemukan utas yang relevan. Saya akan menghargai petunjuk untuk kemungkinan duplikat.
( Ini yang sangat bagus, tetapi tanpa jawaban. Ini juga memiliki semangat yang sama, bahkan dengan jawaban, tetapi yang terakhir terlalu spesifik dari sudut pandang saya. Ini juga dekat, ditemukan setelah memposting pertanyaan.)
Temanya adalah, bagaimana melakukan inferensi statistik yang valid ketika model dirumuskan sebelum melihat data gagal menggambarkan proses pembuatan data secara memadai . Pertanyaannya sangat umum, tetapi saya akan menawarkan contoh khusus untuk menggambarkan hal tersebut. Namun, saya mengharapkan jawaban untuk fokus pada pertanyaan metodologis umum daripada memilih rincian dari contoh tertentu.
Pertimbangkan contoh konkret: dalam pengaturan rangkaian waktu, saya menganggap proses pembuatan data menjadi dengan . Saya bertujuan untuk menguji hipotesis pokok bahasan bahwa . Saya menggunakan ini dalam bentuk model untuk mendapatkan mitra statistik yang bisa diterapkan dari hipotesis materi pelajaran saya, dan ini adalah Sejauh ini bagus. Tetapi ketika saya mengamati data, saya menemukan bahwa model tidak cukup menggambarkan data. Katakanlah, ada tren linier, sehingga proses pembuatan data sebenarnya adalah dengan ut∼i. i. N(0,σ 2 u )dy
Bagaimana saya bisa melakukan inferensi statistik yang valid pada hipotesis subjek-materi saya ?
Jika saya menggunakan model asli, asumsinya dilanggar dan penaksir tidak memiliki distribusi yang bagus seperti yang seharusnya. Oleh karena itu, saya tidak dapat menguji hipotesis dengan menggunakan uji- . t
Jika, setelah melihat data, saya beralih dari model ke dan mengubah hipotesis statistik saya dari menjadi , asumsi model puas dan saya dapatkan estimator yang berperilaku baik dari dan dapat menguji tanpa kesulitan menggunakan uji- . Namun, beralih dari ke( 2 ) H 0 : β 1 = 1 H ′ 0 : γ 1 = 1 γ 1 H ′ 0 t ( 1 ) ( 2 )
diinformasikan oleh set data yang ingin saya uji hipotesis. Hal ini membuat distribusi estimator (dan juga inferensi) bergantung pada perubahan model yang mendasarinya, yang disebabkan oleh data yang diamati. Jelas, pengenalan pengkondisian semacam itu tidak memuaskan.
Apakah ada jalan keluar yang bagus? (Jika tidak sering, maka mungkin beberapa alternatif Bayesian?)