Pertanyaan yang diberi tag «multicollinearity»

Situasi ketika ada hubungan linear yang kuat antara variabel-variabel prediktor, sehingga matriks korelasinya menjadi (hampir) tunggal. "Kondisi buruk" ini membuat sulit untuk menentukan peran unik yang dimainkan oleh masing-masing prediktor: masalah estimasi muncul dan kesalahan standar meningkat. Prediktor berkorelasi sangat tinggi adalah salah satu contoh multikolinieritas.

2
Pengodean variabel kualitatif dalam regresi mengarah ke "singularitas"
Saya memiliki variabel independen yang disebut "kualitas"; variabel ini memiliki 3 modalitas respons (kualitas buruk; kualitas sedang; kualitas tinggi). Saya ingin memperkenalkan variabel independen ini ke dalam regresi linier berganda. Ketika saya memiliki variabel independen biner (variabel dummy, saya dapat kode 0/ 1) mudah untuk memperkenalkannya ke dalam model regresi …


1
Regresi Logistik - Masalah / Jebakan Multikolinearitas
Dalam Regresi Logistik, adakah kebutuhan untuk mempedulikan multikolinieritas seperti halnya Anda akan menggunakan regresi OLS langsung? Misalnya, dengan regresi logistik, di mana terdapat multikolinieritas, apakah Anda harus berhati-hati (seperti halnya dalam regresi OLS) dengan mengambil kesimpulan dari koefisien Beta? Untuk regresi OLS satu "memperbaiki" ke multikolinieritas tinggi adalah regresi ridge, …

3
Kapan kita dapat berbicara tentang kolinearitas
Dalam model linier kita perlu memeriksa apakah ada hubungan antara variabel penjelas. Jika mereka berkorelasi terlalu banyak maka ada collinearity (yaitu, sebagian variabel saling menjelaskan satu sama lain). Saat ini saya hanya melihat korelasi berpasangan antara masing-masing variabel penjelas. Pertanyaan 1: Apa yang mengklasifikasikan korelasi terlalu banyak? Misalnya, apakah korelasi …

1
Mengapa regresi ini TIDAK gagal karena multikolinieritas sempurna, walaupun satu variabel adalah kombinasi linear dari yang lain?
Hari ini, saya bermain-main dengan dataset kecil dan melakukan regresi OLS sederhana yang saya harapkan gagal karena multikolinieritas sempurna. Namun, ternyata tidak. Ini menyiratkan bahwa pemahaman saya tentang multikolinieritas salah. Pertanyaan saya adalah: Di mana saya salah? Saya pikir saya dapat menunjukkan bahwa salah satu variabel saya adalah kombinasi linear …

1
Apa intuisi di balik sampel yang dapat ditukar di bawah hipotesis nol?
Tes permutasi (juga disebut tes pengacakan, uji pengacakan ulang, atau tes yang tepat) sangat berguna dan berguna ketika asumsi distribusi normal yang diperlukan misalnya, t-testtidak terpenuhi dan ketika transformasi nilai dengan peringkat dari tes non-parametrik seperti Mann-Whitney-U-testakan menyebabkan lebih banyak informasi hilang. Namun, satu dan hanya satu asumsi yang tidak …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
VIF, Indeks kondisi dan nilai eigen
Saat ini saya menilai multikolinearitas dalam dataset saya. Nilai ambang VIF dan indeks kondisi apa di bawah / di atas yang menunjukkan masalah? VIF: Saya telah mendengar bahwa VIF adalah masalah.≥ 10≥10\geq 10 Setelah menghapus dua variabel masalah, VIF adalah untuk setiap variabel. Apakah variabel-variabel tersebut memerlukan lebih banyak perawatan …

4
Haruskah orang memperhatikan multi-collinearity saat menggunakan model non-linear?
Katakanlah kita memiliki masalah klasifikasi biner dengan sebagian besar fitur kategorikal. Kami menggunakan beberapa model non-linear (mis. XGBoost atau Random Forests) untuk mempelajarinya. Haruskah orang masih khawatir tentang multi-collinearity? Mengapa? Jika jawaban di atas benar, bagaimana seharusnya seseorang melawannya mengingat dia menggunakan jenis model non-linear ini?

2
Regresi linear ketika Anda hanya tahu
Misalkan .Xβ=YXβ=YX\beta =Y Kita tidak tahu persis, hanya korelasinya dengan masing-masing prediktor, .YYYXtYXtYX^\mathrm{t}Y Solusi kuadrat-terkecil (OLS) adalah dan tidak ada masalah.β=(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y Tapi anggaplah mendekati singular (multicollinearity), dan Anda perlu memperkirakan parameter ridge yang optimal. Semua metode tampaknya membutuhkan nilai tepat .XtXXtXX^\mathrm{t}XYYY Apakah ada metode alternatif ketika hanya yang …

2
Apa itu tes chunk?
Sebagai jawaban atas pertanyaan tentang pemilihan model di hadapan multikolinieritas , Frank Harrell menyarankan : Masukkan semua variabel dalam model tetapi jangan menguji efek dari satu variabel yang disesuaikan untuk efek variabel yang bersaing ... Tes chunk dari variabel yang bersaing kuat karena variabel collinear bergabung dalam keseluruhan uji derajat …



3
Apakah saya perlu membuang variabel yang berkorelasi / collinear sebelum menjalankan kmeans?
Saya menjalankan kmeans untuk mengidentifikasi kelompok pelanggan. Saya memiliki sekitar 100 variabel untuk mengidentifikasi cluster. Masing-masing variabel ini mewakili% pengeluaran oleh pelanggan pada suatu kategori. Jadi, jika saya memiliki 100 kategori, saya memiliki 100 variabel ini sehingga jumlah dari variabel-variabel ini adalah 100% untuk setiap pelanggan. Sekarang, variabel-variabel ini sangat …

3
Bagaimana Anda bisa menangani estimasi tidak stabil dalam regresi linier dengan multi-collinearity tinggi tanpa membuang variabel?
Stabilitas beta dalam regresi linier dengan multi-collinearity tinggi? Katakanlah dalam regresi linier, variabel dan memiliki multi-collinearity tinggi (korelasi sekitar 0,9).x 2x1x1x_1x2x2x_2 Kami khawatir tentang stabilitas koefisien sehingga kami harus memperlakukan multi-collinearity.ββ\beta Solusi buku teks akan hanya membuang salah satu variabel. Tetapi kami tidak ingin kehilangan informasi yang berguna hanya dengan …

2
Berurusan dengan multikolinieritas
Saya telah belajar bahwa dengan menggunakan vif()metode carpaket, kita dapat menghitung tingkat multikolinieritas input dalam suatu model. Dari wikipedia , jika vifnilainya lebih besar dari 5itu kita dapat mempertimbangkan bahwa input tersebut menderita masalah multikolinieritas. Sebagai contoh, saya telah mengembangkan model regresi linier menggunakan lm()metode dan vif()memberikan sebagai berikut. Seperti …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.