Pertanyaan yang diberi tag «importance»

Pentingnya variabel independen atau prediktor dalam menjelaskan atau memprediksi hasil yang menarik.

2
Ukuran variabel penting dalam hutan acak
Saya telah bermain-main dengan hutan acak untuk regresi dan saya mengalami kesulitan mencari tahu apa arti dua ukuran penting itu, dan bagaimana mereka harus ditafsirkan. The importance()Fungsi memberikan dua nilai untuk setiap variabel: %IncMSEdan IncNodePurity. Apakah ada interpretasi sederhana untuk 2 nilai ini? Untuk IncNodePuritykhususnya, ini hanya jumlah peningkatan RSS …

4
Untuk apa peringkat kepentingan variabel berguna?
Saya telah menjadi semacam nihilis ketika datang ke peringkat tingkat kepentingan variabel (dalam konteks model multivarian dari semua jenis). Seringkali dalam perjalanan pekerjaan saya, saya diminta untuk membantu tim lain menghasilkan peringkat kepentingan variabel, atau menghasilkan peringkat kepentingan variabel dari pekerjaan saya sendiri. Menanggapi permintaan ini, saya mengajukan pertanyaan berikut …



2
Variabel kepentingan dari GLMNET
Saya melihat menggunakan laso sebagai metode untuk memilih fitur dan menyesuaikan model prediksi dengan target biner. Di bawah ini adalah beberapa kode yang saya mainkan untuk mencoba metode ini dengan regresi logistik yang teratur. Pertanyaan saya adalah apakah saya mendapatkan sekelompok variabel "signifikan" tetapi apakah saya dapat menentukan urutannya untuk …


2
Fitur penting dengan variabel dummy
Saya mencoba memahami bagaimana saya bisa mendapatkan fitur penting dari variabel kategori yang telah dipecah menjadi variabel dummy. Saya menggunakan scikit-learn yang tidak menangani variabel kategorikal untuk Anda seperti R atau h2o. Jika saya memecah variabel kategori menjadi variabel dummy, saya mendapatkan fitur penting terpisah per kelas dalam variabel itu. …


4
Membandingkan pentingnya berbagai set alat prediksi
Saya menasihati seorang siswa peneliti dengan masalah tertentu, dan saya ingin mendapatkan masukan dari orang lain di situs ini. Konteks: Peneliti memiliki tiga jenis variabel prediktor. Setiap jenis berisi jumlah variabel prediktor yang berbeda. Setiap prediktor adalah variabel kontinu: Sosial: S1, S2, S3, S4 (yaitu, empat prediktor) Kognitif: C1, C2 …

1
Dalam Random Forest, mengapa subset acak fitur dipilih di level node daripada di level tree?
Pertanyaan Saya: Mengapa hutan acak mempertimbangkan himpunan bagian acak dari fitur untuk pemisahan pada tingkat simpul dalam setiap pohon daripada di tingkat pohon ? Latar Belakang: Ini adalah pertanyaan sejarah. Tin Kam Ho menerbitkan makalah ini tentang membangun "hutan keputusan" dengan secara acak memilih subset fitur yang akan digunakan untuk …


1
randomForest dan bug pentingnya variabel?
Saya tidak mendapatkan perbedaan antara rfobject$importancedan importance(rfobject)di kolom MeanDecreaseAccuracy. Contoh: > data("iris") > fit <- randomForest(Species~., data=iris, importance=TRUE) > fit$importance setosa versicolor virginica MeanDecreaseAccuracy MeanDecreaseGini Sepal.Length 0.027078501 0.019418330 0.040497602 0.02898837 9.173648 Sepal.Width 0.008553449 0.001962036 0.006951771 0.00575489 2.472105 Petal.Length 0.313303381 0.291818815 0.280981959 0.29216790 41.284869 Petal.Width 0.349686983 0.318527008 0.270975757 0.31054451 46.323415 > …


1
Bagaimana cara membandingkan acara yang diamati dengan yang diharapkan?
Misalkan saya punya satu sampel frekuensi dari 4 peristiwa yang mungkin: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 dan saya memiliki probabilitas yang diharapkan dari peristiwa saya terjadi: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dengan jumlah frekuensi yang diamati …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
Kekuatan penjelas suatu variabel
Saya memiliki model regresi linier sederhana. Yang ingin saya hitung adalah seberapa "penting" masing-masing variabel input saya yaitu membuat pernyataan seperti ini: "60% daya prediksi dalam model ini berasal dari variabel var1, di mana var2 dan var3 memiliki masing-masing 30% dan 10%" Apa yang perlu saya lakukan untuk menghitung persentase …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.