Apakah regresi dengan kesalahan siswa tidak berguna?


10

Silakan lihat edit.

Ketika Anda memiliki data dengan ekor yang berat, melakukan regresi dengan kesalahan siswa-t sepertinya hal yang intuitif untuk dilakukan. Sambil menjelajahi kemungkinan ini, saya menemukan makalah ini:

Breusch, TS, Robertson, JC, & Welsh, AH (01 November 1997). Pakaian baru kaisar: kritik terhadap model regresi t multivariat. Statistica Neerlandica, 51, 3.) ( tautan , pdf )

Yang berpendapat bahwa parameter skala dan parameter derajat kebebasan tidak dapat diidentifikasi sehubungan satu sama lain dalam beberapa hal dan bahwa karena ini melakukan regresi dengan kesalahan t tidak melakukan apa-apa di luar apa yang dilakukan regresi linier standar.

Zellner (1976) mengusulkan model regresi di mana vektor data (atau vektor kesalahan) direpresentasikan sebagai realisasi dari distribusi t multivariat Siswa. Model ini telah menarik perhatian karena tampaknya memperluas asumsi Gaussian yang biasa untuk memungkinkan distribusi kesalahan yang lebih berat. Sejumlah hasil dalam literatur menunjukkan bahwa prosedur inferensi standar untuk model Gaussian tetap sesuai di bawah asumsi distribusi yang lebih luas, yang mengarah pada klaim kekokohan metode standar. Kami menunjukkan bahwa, meskipun secara matematis kedua model berbeda, untuk tujuan inferensi statistik mereka tidak dapat dibedakan. Implikasi empiris dari model multivariat t persis sama dengan implikasi model Gaussian. Oleh karena itu saran dari representasi distribusi yang lebih luas dari data adalah palsu, dan klaim ketahanan adalah menyesatkan. Kesimpulan ini dicapai dari perspektif frequentist dan Bayesian.

Ini mengejutkan saya.

Saya tidak memiliki kecanggihan matematis untuk mengevaluasi argumen mereka dengan baik, jadi saya punya beberapa pertanyaan: Apakah benar melakukan regresi dengan t-error umumnya tidak bermanfaat? Jika kadang-kadang bermanfaat, pernahkah saya salah memahami makalah atau apakah itu menyesatkan? Jika mereka tidak berguna, apakah ini fakta yang diketahui? Apakah ada cara lain untuk memperhitungkan data dengan ekor besar?

Sunting : Setelah membaca lebih dekat, dari paragraf 3 dan bagian 4, sepertinya makalah di bawah ini tidak berbicara tentang apa yang saya pikirkan sebagai regresi siswa-t (kesalahan adalah distribusi univariat independen t). Kesalahannya bukan diambil dari distribusi tunggal dan tidak independen. Jika saya mengerti dengan benar, kurangnya kemandirian inilah yang menjelaskan mengapa Anda tidak dapat memperkirakan skala dan tingkat kebebasan secara mandiri.

Saya kira makalah ini menyediakan daftar makalah untuk menghindari membaca.


Apakah Anda yakin Anda diizinkan mendistribusikan kertas melalui dropbox? lebih baik periksa
Toby El Tejedor

Saya pikir distribusi laplace memberi Anda kesempatan untuk memperlakukan ekor yang berat sampai tingkat tertentu.
Toby El Tejedor

Jawaban:


5

Hasil edit Anda benar. Hasil yang disajikan dalam makalah ini hanya berlaku untuk kesalahan multivarian-t. Jika Anda menggunakan kesalahan t independen, maka Anda aman.

Saya tidak berpikir makalah ini terkenal, tetapi saya pikir itu benar.

Literatur statistik penuh dengan "generalisasi" yang dalam banyak kasus adalah reparameterisasi, transformasi satu-ke-satu atau kadang-kadang tidak berguna karena mereka tidak berkontribusi secara signifikan dalam menggeneralisasi beberapa sifat dari model yang bersangkutan.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.