Silakan lihat edit.
Ketika Anda memiliki data dengan ekor yang berat, melakukan regresi dengan kesalahan siswa-t sepertinya hal yang intuitif untuk dilakukan. Sambil menjelajahi kemungkinan ini, saya menemukan makalah ini:
Breusch, TS, Robertson, JC, & Welsh, AH (01 November 1997). Pakaian baru kaisar: kritik terhadap model regresi t multivariat. Statistica Neerlandica, 51, 3.) ( tautan , pdf )
Yang berpendapat bahwa parameter skala dan parameter derajat kebebasan tidak dapat diidentifikasi sehubungan satu sama lain dalam beberapa hal dan bahwa karena ini melakukan regresi dengan kesalahan t tidak melakukan apa-apa di luar apa yang dilakukan regresi linier standar.
Zellner (1976) mengusulkan model regresi di mana vektor data (atau vektor kesalahan) direpresentasikan sebagai realisasi dari distribusi t multivariat Siswa. Model ini telah menarik perhatian karena tampaknya memperluas asumsi Gaussian yang biasa untuk memungkinkan distribusi kesalahan yang lebih berat. Sejumlah hasil dalam literatur menunjukkan bahwa prosedur inferensi standar untuk model Gaussian tetap sesuai di bawah asumsi distribusi yang lebih luas, yang mengarah pada klaim kekokohan metode standar. Kami menunjukkan bahwa, meskipun secara matematis kedua model berbeda, untuk tujuan inferensi statistik mereka tidak dapat dibedakan. Implikasi empiris dari model multivariat t persis sama dengan implikasi model Gaussian. Oleh karena itu saran dari representasi distribusi yang lebih luas dari data adalah palsu, dan klaim ketahanan adalah menyesatkan. Kesimpulan ini dicapai dari perspektif frequentist dan Bayesian.
Ini mengejutkan saya.
Saya tidak memiliki kecanggihan matematis untuk mengevaluasi argumen mereka dengan baik, jadi saya punya beberapa pertanyaan: Apakah benar melakukan regresi dengan t-error umumnya tidak bermanfaat? Jika kadang-kadang bermanfaat, pernahkah saya salah memahami makalah atau apakah itu menyesatkan? Jika mereka tidak berguna, apakah ini fakta yang diketahui? Apakah ada cara lain untuk memperhitungkan data dengan ekor besar?
Sunting : Setelah membaca lebih dekat, dari paragraf 3 dan bagian 4, sepertinya makalah di bawah ini tidak berbicara tentang apa yang saya pikirkan sebagai regresi siswa-t (kesalahan adalah distribusi univariat independen t). Kesalahannya bukan diambil dari distribusi tunggal dan tidak independen. Jika saya mengerti dengan benar, kurangnya kemandirian inilah yang menjelaskan mengapa Anda tidak dapat memperkirakan skala dan tingkat kebebasan secara mandiri.
Saya kira makalah ini menyediakan daftar makalah untuk menghindari membaca.