Pertanyaan yang diberi tag «feature-selection»

Metode dan prinsip pemilihan subset atribut untuk digunakan dalam pemodelan lebih lanjut

1
Analisis Sensitivitas dalam Jaringan Saraf Tiruan
Mengikuti pertanyaan yang sudah dijawab ( Mengekstraksi bobot penting dari jaringan umpan-maju Satu-Lapisan ) Saya mencari kesimpulan tentang relevansi input dalam jaringan saraf. Mempertimbangkan jaring yang dalam, di mana merekonstruksi kepentingan input dengan mundur melewati lapisan-lapisan dari simpul keluaran yang menarik mungkin sulit atau memakan waktu, saya bertanya-tanya apakah ada …

1
Bayesian laso vs spike dan slab
Pertanyaan: Apa keuntungan / kerugian dari menggunakan satu sebelum yang lain untuk pemilihan variabel? Misalkan saya memiliki kemungkinan: di mana saya dapat menempatkan salah satu prior: w i ~ π delta 0 + ( 1 - π ) N ( 0 , 100 )y∼ N( Xw , σ2saya)y∼N(Xw,σ2I)y\sim\mathcal{N}(Xw,\sigma^2I) atau: w …

3
Mengapa jaringan saraf memerlukan pemilihan fitur / rekayasa?
Khususnya dalam konteks kompetisi kaggle saya perhatikan bahwa kinerja model adalah semua tentang pemilihan fitur / teknik. Sementara saya dapat sepenuhnya memahami mengapa hal ini terjadi ketika berhadapan dengan algoritma ML yang lebih konvensional / jadul, saya tidak melihat mengapa ini akan menjadi kasus ketika menggunakan jaringan saraf yang dalam. …

3
Bagaimana seharusnya Seleksi Fitur dan optimasi Hyperparameter dipesan dalam pipa pembelajaran mesin?
Tujuan saya adalah mengklasifikasikan sinyal sensor. Konsep solusi saya sejauh ini adalah: i) Fitur teknik dari sinyal mentah ii) Memilih fitur yang relevan dengan ReliefF dan pendekatan pengelompokan iii) Menerapkan NN, Random Forest dan SVM Namun saya terjebak dalam dilema. Dalam ii) dan iii), ada hiperparameter seperti k-Neigbours terdekat untuk …

2
Mengapa pemilihan subset terbaik tidak disukai dibandingkan dengan laso?
Saya membaca tentang pemilihan subset terbaik dalam Elemen buku pembelajaran statistik. Jika saya memiliki 3 prediktor , saya membuat 2 3 = 8x1,x2,x3x1,x2,x3x_1,x_2,x_323=823=82^3=8 himpunan bagian: Subset tanpa prediktor himpunan bagian dengan prediktor x1x1x_1 himpunan bagian dengan prediktor x2x2x_2 bagian dengan prediktor x3x3x_3 himpunan bagian dengan prediktor x1,x2x1,x2x_1,x_2 himpunan bagian dengan …

2
Pendekatan yang bertentangan dengan pemilihan variabel: AIC, nilai-p atau keduanya?
Dari apa yang saya pahami, pemilihan variabel berdasarkan nilai-p (setidaknya dalam konteks regresi) sangat cacat. Tampaknya pemilihan variabel berdasarkan AIC (atau serupa) juga dianggap cacat oleh beberapa, untuk alasan yang sama, meskipun ini tampaknya agak tidak jelas (mis. Lihat pertanyaan saya dan beberapa tautan pada topik ini di sini: Apa …


2
Jika p> n, laso memilih paling banyak n variabel
Salah satu motivasi untuk jaring elastis adalah batasan LASSO sebagai berikut: Dalam kasus p>np>np > n , laso memilih paling banyak n variabel sebelum jenuh, karena sifat masalah optimisasi cembung. Ini tampaknya menjadi fitur pembatas untuk metode pemilihan variabel. Selain itu, laso tidak didefinisikan dengan baik kecuali jika terikat pada …

1
Dalam Random Forest, mengapa subset acak fitur dipilih di level node daripada di level tree?
Pertanyaan Saya: Mengapa hutan acak mempertimbangkan himpunan bagian acak dari fitur untuk pemisahan pada tingkat simpul dalam setiap pohon daripada di tingkat pohon ? Latar Belakang: Ini adalah pertanyaan sejarah. Tin Kam Ho menerbitkan makalah ini tentang membangun "hutan keputusan" dengan secara acak memilih subset fitur yang akan digunakan untuk …



1
Jelaskan langkah-langkah algoritma LLE (local linear embedding)?
Saya mengerti prinsip dasar di balik algoritma untuk LLE terdiri dari tiga langkah. Menemukan lingkungan setiap titik data dengan beberapa metrik seperti k-nn. Temukan bobot untuk setiap tetangga yang menunjukkan efek yang dimiliki tetangga pada titik data. Bangun penyisipan data dimensi rendah berdasarkan bobot yang dihitung. Tetapi penjelasan matematis dari …


2
Menemukan fitur terbaik dalam model interaksi
Saya punya daftar protein dengan nilai fitur mereka. Tabel sampel terlihat seperti ini: ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 Baris adalah protein dan kolom adalah fitur. Saya juga punya daftar protein yang berinteraksi juga; sebagai contoh Protein3, Protein4 Protein1, Protein2 Protein4, Protein1 Masalah : Untuk analisis awal saya ingin tahu fitur …

3
Distribusi probabilitas pengelompokan - metode & metrik?
Saya memiliki beberapa titik data, masing-masing berisi 5 vektor hasil diskrit diaglomerasi, setiap hasil vektor dihasilkan oleh distribusi yang berbeda, (jenis spesifik yang saya tidak yakin, tebakan terbaik saya adalah Weibull, dengan parameter bentuk bervariasi di sekitar eksponensial ke daya hukum (1 hingga 0, kurang lebih).) Saya mencari untuk menggunakan …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.