Jawaban singkatnya adalah ya.
Pertama-tama (seperti yang ditunjukkan oleh Ruben van Bergen), distribusi (atau , dalam hal ini) tidak relevan. Jika Anda membuat asumsi distribusi, itu akan menjadi residu Anda , jadi itulah yang harus Anda periksa.yXε
Tetapi yang lebih penting, Anda tidak memerlukan asumsi normal sama sekali agar estimasi Anda berfungsi. Anda menggunakan lm
fungsi R , yang memperkirakan model Anda menggunakan kuadrat terkecil biasa (OLS) . Metode itu akan memberi Anda perkiraan yang benar dari ekspektasi bersyarat pada selama:YX
- E[ε|X]=0 (tidak ada faktor eksternal yang memengaruhi hasil dan variabel penjelas Anda).
- Var(ε)<∞ (residu Anda memiliki varian terbatas).
Jika Anda lebih lanjut membuat asumsi bahwa residu Anda tidak berkorelasi dan bahwa mereka semua memiliki varian yang sama, maka teorema Gauss-Markov berlaku dan OLS adalah penaksir linear bias (BLUE) terbaik.
Jika residu Anda berkorelasi atau memiliki varian yang berbeda, maka OLS masih berfungsi tetapi bisa jadi kurang tepat, yang harus tercermin dalam cara Anda melaporkan interval kepercayaan perkiraan Anda (menggunakan, katakanlah kesalahan standar yang kuat ).
Jika Anda juga membuat asumsi bahwa residu Anda terdistribusi secara normal, maka OLS menjadi efisien asimptot karena setara dengan kemungkinan maksimum.
Jadi regresi dapat bekerja lebih baik jika data Anda terdistribusi secara normal, tetapi masih akan berfungsi jika tidak.