Masalah multikolinieritas dipelajari dengan baik di sebagian besar buku teks ekonometrik. Selain itu ada artikel bagus di wikipedia yang sebenarnya merangkum sebagian besar masalah utama.
Dalam prakteknya orang mulai mengingat masalah multikolinieritas jika hal itu menyebabkan beberapa tanda-tanda visual dari ketidakstabilan parameter (kebanyakan dari mereka tersirat oleh invertabilitas yang tidak (buruk). XTX matriks):
- perubahan besar dalam estimasi parameter saat melakukan regresi bergulir atau estimasi pada sub-sampel data yang lebih kecil
- rata-rata estimasi parameter, yang terakhir mungkin jatuh menjadi tidak signifikan (oleh t tes) meskipun regresi sampah F Tes menunjukkan signifikansi gabungan yang tinggi dari hasil
- Statistik VIF (nilai rata-rata regresi bantu) hanya tergantung pada persyaratan Anda untuk tingkat toleransi, sebagian besar saran praktis menempatkan toleransi yang dapat diterima lebih rendah dari 0,2 atau 0,1 yang berarti bahwa rata-rata yang sesuai dari regresi bantu R2harus lebih tinggi dari 0,9 atau 0,8 untuk mendeteksi masalah. Dengan demikian VIF harus lebih besar dari nilai rule-of-thumb 10 dan 5. Dalam sampel kecil (kurang dari 50 poin) 5 lebih disukai, lebih besar Anda bisa pergi ke nilai yang lebih besar.
- Indeks kondisi adalah alternatif untuk VIF dalam kasus Anda, baik VIF maupun CI tidak menunjukkan masalah yang tersisa, sehingga Anda mungkin puas secara statistik pada hasil ini, tetapi ...
mungkin tidak secara teoritis, karena itu mungkin terjadi (dan biasanya demikian) bahwa Anda memerlukan semua variabel untuk hadir dalam model. Mengecualikan variabel yang relevan (masalah variabel yang dihilangkan) akan tetap membuat estimasi parameter yang bias dan tidak konsisten. Di sisi lain Anda mungkin terpaksa memasukkan semua variabel fokus hanya karena analisis Anda didasarkan padanya. Dalam pendekatan penambangan data, Anda lebih teknis dalam mencari yang paling cocok.
Jadi perlu diingat alternatif (yang akan saya gunakan sendiri):
- mendapatkan lebih banyak poin data (ingat bahwa persyaratan VIF lebih kecil untuk kumpulan data yang lebih besar dan variabel penjelas jika mereka secara perlahan bervariasi, dapat berubah untuk beberapa poin penting dalam waktu atau penampang)
- mencari faktor lattent melalui komponen utama (yang terakhir adalah kombinasi ortogonal sehingga tidak multi-collinear oleh konstruksi, lebih dari melibatkan semua variabel penjelas)
- ridge-regression (ini memperkenalkan bias kecil dalam estimasi parameter, tetapi membuatnya sangat stabil)
Beberapa trik lain ada di artikel wiki yang disebutkan di atas.