Saya merujuk pada posting ini yang tampaknya mempertanyakan pentingnya distribusi normal residu, dengan alasan bahwa ini bersama dengan heteroskedastisitas berpotensi dapat dihindari dengan menggunakan kesalahan standar yang kuat.
Saya telah mempertimbangkan berbagai transformasi - root, log dll - dan semuanya terbukti tidak berguna dalam menyelesaikan masalah sepenuhnya.
Ini adalah plot QQ dari residu saya:
Data
- Variabel dependen: sudah dengan transformasi logaritmik (memperbaiki masalah outlier dan masalah dengan kemiringan dalam data ini)
- Variabel independen: usia perusahaan, dan sejumlah variabel biner (indikator) (Kemudian saya memiliki beberapa hitungan, untuk regresi terpisah sebagai variabel independen)
The iqr
perintah (Hamilton) di Stata tidak menentukan setiap outlier parah yang mengesampingkan normalitas, tetapi grafik di bawah ini menunjukkan sebaliknya dan begitu juga dengan uji Shapiro-Wilk.
qenv
paket.