Pertanyaan yang diberi tag «feature-selection»

Metode dan prinsip pemilihan subset atribut untuk digunakan dalam pemodelan lebih lanjut

1
Decision tree variabel (fitur) penskalaan dan variabel (fitur) normalisasi (tuning) diperlukan dalam implementasi yang mana?
Dalam banyak algoritme pembelajaran mesin, penskalaan fitur (penskalaan variabel, normalisasi) adalah langkah umum yang belum ada. Wikipedia - Penskalaan Fitur - pertanyaan ini hampir selesai. Pertanyaan # 41704 - Bagaimana dan mengapa kerja normalisasi dan penskalaan fitur berfungsi? Saya punya dua pertanyaan khusus sehubungan dengan Pohon Keputusan: Apakah ada implementasi …

3
Haruskah pemilihan fitur dilakukan hanya pada data pelatihan (atau semua data)?
Haruskah pemilihan fitur dilakukan hanya pada data pelatihan (atau semua data)? Saya telah melalui beberapa diskusi dan makalah seperti Guyon (2003) dan Singhi dan Liu (2006) , tetapi masih tidak yakin tentang jawaban yang benar. Pengaturan percobaan saya adalah sebagai berikut: Dataset: 50-kontrol sehat & 50-pasien penyakit (cca 200 fitur …

1
Bagaimana LASSO memilih di antara prediktor linier?
Saya mencari jawaban intuitif mengapa model GLM LASSO memilih prediktor spesifik dari kelompok yang sangat berkorelasi, dan mengapa itu melakukannya secara berbeda maka pemilihan fitur subset terbaik. Dari geometri LASSO yang ditunjukkan pada Gambar 2 di Tibshirani 1996, saya dituntun untuk percaya bahwa LASSO memilih prediktor dengan varian yang lebih …



4
Apakah ada cara untuk menggunakan validasi silang untuk melakukan pemilihan variabel / fitur di R?
Saya memiliki satu set data dengan sekitar 70 variabel yang ingin saya kurangi. Yang ingin saya lakukan adalah menggunakan CV untuk menemukan variabel yang paling berguna dengan cara berikut. 1) Pilih secara acak katakan 20 variabel. 2) Gunakan stepwise/ LASSO/ lars/ etc untuk memilih variabel yang paling penting. 3) Ulangi …

4
Meningkatkan klasifikasi diabetes SVM
Saya menggunakan SVM untuk memprediksi diabetes. Saya menggunakan set data BRFSS untuk tujuan ini. Kumpulan data memiliki dimensi dan miring. Persentase s dalam variabel target adalah sedangkan s merupakan sisa 89 \% .432607 × 136432607×136432607 \times 136Y11 %11%11\%N89 %89%89\% Saya hanya menggunakan 15dari 136variabel independen dari set data. Salah satu …


1
Bagaimana cara mengukur redundansi fitur?
Saya memiliki tiga fitur yang saya gunakan untuk menyelesaikan masalah klasifikasi. Awalnya, fitur-fitur ini menghasilkan nilai boolean, jadi saya bisa mengevaluasi redundansi mereka dengan melihat berapa banyak set klasifikasi positif dan negatif yang tumpang tindih. Sekarang saya telah memperluas fitur untuk menghasilkan nilai nyata (skor), dan saya ingin menganalisis redundansi …

3
Mengidentifikasi fitur yang difilter setelah pemilihan fitur dengan scikit belajar
Ini kode saya untuk metode pemilihan fitur dengan Python: from sklearn.svm import LinearSVC from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target X.shape (150, 4) X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y) X_new.shape (150, 3) Tetapi setelah mendapatkan X baru (variabel dependen - X_new), Bagaimana saya tahu variabel …


3
Bisakah variabel independen dengan korelasi rendah dengan variabel dependen menjadi prediktor signifikan?
Saya memiliki delapan variabel independen dan satu dependen. Saya telah menjalankan matriks korelasi, dan 5 di antaranya memiliki korelasi rendah dengan DV. Saya kemudian menjalankan beberapa regresi bertahap untuk melihat apakah ada / semua IVs dapat memprediksi DV. Regresi menunjukkan bahwa hanya dua IV yang dapat memprediksi DV (hanya dapat …

3
Cara mengurangi prediktor dengan cara yang tepat untuk model regresi logistik
Jadi saya telah membaca beberapa buku (atau bagian dari mereka) tentang pemodelan (F. Harrell "Strategi Pemodelan Regresi" antara lain), karena situasi saya saat ini adalah bahwa saya perlu melakukan model logistik berdasarkan data respon biner. Saya memiliki data kontinu, kategoris, dan biner (prediktor) dalam kumpulan data saya. Pada dasarnya saya …

3
Pemilihan model Bayesian dan interval yang kredibel
Saya memiliki dataset dengan tiga variabel, di mana semua variabel kuantitatif. Sebut saja yyy , x1x1x_1 dan x2x2x_2 . Saya menyesuaikan model regresi dalam perspektif Bayesian via MCMC denganrjags Saya melakukan analisis eksplorasi dan sebar y×x2y×x2y\times x_2 menunjukkan bahwa istilah kuadrat harus digunakan. Lalu saya memasang dua model (1) y=β0+β1∗x1+β2∗x2y=β0+β1∗x1+β2∗x2y=\beta_0+\beta_1*x_1+\beta_2*x_2 …

3
Pemilihan fitur menggunakan pembelajaran mendalam?
Saya ingin menghitung pentingnya setiap fitur input menggunakan model yang mendalam. Tetapi saya hanya menemukan satu makalah tentang pemilihan fitur menggunakan pembelajaran mendalam - pemilihan fitur dalam . Mereka menyisipkan lapisan node yang terhubung ke setiap fitur secara langsung, sebelum lapisan tersembunyi pertama. Saya mendengar bahwa jaringan kepercayaan yang mendalam …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.