Pertanyaan yang diberi tag «multicollinearity»

Situasi ketika ada hubungan linear yang kuat antara variabel-variabel prediktor, sehingga matriks korelasinya menjadi (hampir) tunggal. "Kondisi buruk" ini membuat sulit untuk menentukan peran unik yang dimainkan oleh masing-masing prediktor: masalah estimasi muncul dan kesalahan standar meningkat. Prediktor berkorelasi sangat tinggi adalah salah satu contoh multikolinieritas.

9
Apakah ada penjelasan intuitif mengapa multikolinearitas merupakan masalah dalam regresi linier?
Wiki membahas masalah yang muncul ketika multikolinieritas merupakan masalah dalam regresi linier. Masalah dasarnya adalah hasil multikolinieritas dalam estimasi parameter yang tidak stabil yang membuatnya sangat sulit untuk menilai pengaruh variabel independen terhadap variabel dependen. Saya mengerti alasan teknis di balik masalah (mungkin tidak dapat membalikkan , - dikondisikan dll) …

9
Mengapa mungkin untuk mendapatkan statistik F yang signifikan (p <0,001) tetapi uji-t regresi yang tidak signifikan?
Dalam regresi linier berganda, mengapa mungkin untuk memiliki statistik F yang sangat signifikan (p &lt;0,001) tetapi memiliki nilai p yang sangat tinggi pada semua uji t regresi? Dalam model saya, ada 10 regresi. Satu memiliki nilai p 0,1 dan sisanya di atas 0,9 Untuk mengatasi masalah ini lihat pertanyaan tindak …

1
Korelasi apa yang menjadikan matriks singular dan apa implikasi singularitas atau hampir singularitas?
Saya melakukan beberapa perhitungan pada matriks yang berbeda (terutama dalam regresi logistik) dan saya biasanya mendapatkan kesalahan "Matriks singular", di mana saya harus kembali dan menghapus variabel yang berkorelasi. Pertanyaan saya di sini adalah apa yang Anda anggap sebagai matriks berkorelasi "sangat"? Apakah ada nilai ambang korelasi untuk mewakili kata …

3
Apa efek dari memiliki prediktor yang berkorelasi dalam model regresi berganda?
Saya belajar di kelas model linier saya bahwa jika dua prediktor berkorelasi dan keduanya termasuk dalam model, satu akan tidak signifikan. Sebagai contoh, asumsikan ukuran rumah dan jumlah kamar tidur berkorelasi. Ketika memperkirakan biaya rumah menggunakan dua prediktor ini, salah satunya dapat dijatuhkan karena keduanya memberikan banyak informasi yang sama. …

6
Mengapa multikolinieritas tidak diperiksa dalam statistik modern / pembelajaran mesin
Dalam statistik tradisional, saat membangun model, kami memeriksa multikolinieritas menggunakan metode seperti perkiraan variance inflation factor (VIF), tetapi dalam pembelajaran mesin, kami menggunakan regularisasi untuk pemilihan fitur dan sepertinya tidak memeriksa apakah fitur berkorelasi sama sekali. Mengapa kita melakukan itu?


3
Faktor inflasi varians manakah yang harus saya gunakan: atau ?
Saya mencoba untuk menafsirkan faktor inflasi varians menggunakan viffungsi dalam paket R car. Fungsi ini mencetak dan juga . Menurut file bantuan , ini nilai terakhirVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Untuk menyesuaikan dimensi ellipsoid kepercayaan, fungsi ini juga mencetak GVIF ^ [1 / (2 * df)] di mana df adalah derajat kebebasan yang terkait …

3
Bagaimana cara menangani multikolinieritas saat melakukan pemilihan variabel?
Saya memiliki dataset dengan 9 variabel independen kontinu. Saya mencoba untuk memilih antara variabel-variabel ini sesuai model untuk persentase tunggal (tergantung) variabel, Score. Sayangnya, saya tahu akan ada kolinearitas yang serius antara beberapa variabel. Saya sudah mencoba menggunakan stepAIC()fungsi dalam R untuk pemilihan variabel, tetapi metode itu, anehnya, tampaknya sensitif …


2
Diagnostik collinearity hanya bermasalah ketika istilah interaksi dimasukkan
Saya telah menjalankan regresi pada negara bagian AS, dan saya memeriksa kolinearitas dalam variabel 'independen' saya. Diagnostik Regresi Belsley, Kuh, dan Welsch menyarankan untuk melihat pada Indeks Kondisi dan Proporsi Dekomposisi Varians: library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition Index Variance Decomposition Proportions (Intercept) inc09_10k unins09 sqmi_log pop10_perSqmi_log …

5
Bagaimana cara menguji dan menghindari multikolinearitas dalam model linier campuran?
Saat ini saya menjalankan beberapa model linear efek campuran. Saya menggunakan paket "lme4" di R. Model saya mengambil bentuk: model &lt;- lmer(response ~ predictor1 + predictor2 + (1 | random effect)) Sebelum menjalankan model saya, saya memeriksa kemungkinan multikolinieritas antara prediktor. Saya melakukan ini dengan: Buat kerangka data prediksi dummy_df …

2
Apakah PCA tidak stabil di bawah multikolinieritas?
Saya tahu bahwa dalam situasi regresi, jika Anda memiliki satu set variabel yang sangat berkorelasi ini biasanya "buruk" karena ketidakstabilan dalam koefisien yang diperkirakan (varians menuju infinity sebagai determinan menuju nol). Pertanyaan saya adalah apakah "kejahatan" ini tetap ada dalam situasi PCA. Apakah vektor koefisien / beban / bobot / …


1
Apakah ada alasan untuk memilih ukuran multikolinearitas tertentu?
Ketika bekerja dengan banyak variabel input, kita sering khawatir tentang multikolinieritas . Ada sejumlah ukuran multikolinieritas yang digunakan untuk mendeteksi, memikirkan, dan / atau mengkomunikasikan multikolinieritas. Beberapa rekomendasi umum adalah: The multiple untuk variabel tertentu R2jRj2R^2_j Toleransi, , untuk variabel tertentu 1−R2j1−Rj21-R^2_j Varians inflasi varians, , untuk variabel tertentu VIF=1toleranceVIF=1tolerance\text{VIF}=\frac{1}{\text{tolerance}} …

1
Bagaimana cara menghadapi korelasi yang tinggi di antara para prediktor dalam regresi berganda?
Saya menemukan referensi di artikel yang berbunyi seperti: Menurut Tabachnick &amp; Fidell (1996) variabel independen dengan korelasi bivariat lebih dari 0,70 tidak boleh dimasukkan dalam analisis regresi berganda. Masalah: Saya digunakan dalam desain regresi berganda 3 variabel berkorelasi&gt; 0,80, VIF sekitar 0,2 - .3, Toleransi ~ 4- 5. Saya tidak …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.