Statistik dan Big Data feature-selection

1

Analisis Sensitivitas dalam Jaringan Saraf Tiruan

Mengikuti pertanyaan yang sudah dijawab ( Mengekstraksi bobot penting dari jaringan umpan-maju Satu-Lapisan ) Saya mencari kesimpulan tentang relevansi input dalam jaringan saraf. Mempertimbangkan jaring yang dalam, di mana merekonstruksi kepentingan input dengan mundur melewati lapisan-lapisan dari simpul keluaran yang menarik mungkin sulit atau memakan waktu, saya bertanya-tanya apakah ada …

14 neural-networks python feature-selection sensitivity-analysis

1

Bayesian laso vs spike dan slab

Pertanyaan: Apa keuntungan / kerugian dari menggunakan satu sebelum yang lain untuk pemilihan variabel? Misalkan saya memiliki kemungkinan: di mana saya dapat menempatkan salah satu prior: w i ~ π delta 0 + ( 1 - π ) N ( 0 , 100 )y∼ N( Xw , σ2saya)y∼N(Xw,σ2I)y\sim\mathcal{N}(Xw,\sigma^2I) atau: w …

14 bayesian feature-selection

3

Mengapa jaringan saraf memerlukan pemilihan fitur / rekayasa?

Khususnya dalam konteks kompetisi kaggle saya perhatikan bahwa kinerja model adalah semua tentang pemilihan fitur / teknik. Sementara saya dapat sepenuhnya memahami mengapa hal ini terjadi ketika berhadapan dengan algoritma ML yang lebih konvensional / jadul, saya tidak melihat mengapa ini akan menjadi kasus ketika menggunakan jaringan saraf yang dalam. …

14 neural-networks deep-learning feature-selection feature-engineering

3

Bagaimana seharusnya Seleksi Fitur dan optimasi Hyperparameter dipesan dalam pipa pembelajaran mesin?

Tujuan saya adalah mengklasifikasikan sinyal sensor. Konsep solusi saya sejauh ini adalah: i) Fitur teknik dari sinyal mentah ii) Memilih fitur yang relevan dengan ReliefF dan pendekatan pengelompokan iii) Menerapkan NN, Random Forest dan SVM Namun saya terjebak dalam dilema. Dalam ii) dan iii), ada hiperparameter seperti k-Neigbours terdekat untuk …

14 feature-selection hyperparameter optimization

2

Mengapa pemilihan subset terbaik tidak disukai dibandingkan dengan laso?

Saya membaca tentang pemilihan subset terbaik dalam Elemen buku pembelajaran statistik. Jika saya memiliki 3 prediktor , saya membuat 2 3 = 8x1,x2,x3x1,x2,x3x_1,x_2,x_323=823=82^3=8 himpunan bagian: Subset tanpa prediktor himpunan bagian dengan prediktor x1x1x_1 himpunan bagian dengan prediktor x2x2x_2 bagian dengan prediktor x3x3x_3 himpunan bagian dengan prediktor x1,x2x1,x2x_1,x_2 himpunan bagian dengan …

13 regression feature-selection lasso bias-variance-tradeoff

2

Pendekatan yang bertentangan dengan pemilihan variabel: AIC, nilai-p atau keduanya?

Dari apa yang saya pahami, pemilihan variabel berdasarkan nilai-p (setidaknya dalam konteks regresi) sangat cacat. Tampaknya pemilihan variabel berdasarkan AIC (atau serupa) juga dianggap cacat oleh beberapa, untuk alasan yang sama, meskipun ini tampaknya agak tidak jelas (mis. Lihat pertanyaan saya dan beberapa tautan pada topik ini di sini: Apa …

13 hypothesis-testing multiple-regression feature-selection model-selection aic

2

Apa perbedaan antara pemilihan fitur dan pengurangan dimensi?

Saya tahu bahwa pemilihan fitur dan pengurangan dimensi bertujuan mengurangi jumlah fitur dalam set fitur asli. Apa perbedaan yang tepat antara keduanya jika kita melakukan hal yang sama pada keduanya?

13 machine-learning pca feature-selection dimensionality-reduction

2

Jika p> n, laso memilih paling banyak n variabel

Salah satu motivasi untuk jaring elastis adalah batasan LASSO sebagai berikut: Dalam kasus p>np>np > n , laso memilih paling banyak n variabel sebelum jenuh, karena sifat masalah optimisasi cembung. Ini tampaknya menjadi fitur pembatas untuk metode pemilihan variabel. Selain itu, laso tidak didefinisikan dengan baik kecuali jika terikat pada …

13 regression optimization feature-selection lasso

1

Dalam Random Forest, mengapa subset acak fitur dipilih di level node daripada di level tree?

Pertanyaan Saya: Mengapa hutan acak mempertimbangkan himpunan bagian acak dari fitur untuk pemisahan pada tingkat simpul dalam setiap pohon daripada di tingkat pohon ? Latar Belakang: Ini adalah pertanyaan sejarah. Tin Kam Ho menerbitkan makalah ini tentang membangun "hutan keputusan" dengan secara acak memilih subset fitur yang akan digunakan untuk …

13 machine-learning feature-selection random-forest importance history

2

Apakah ada keadaan di mana regresi bertahap harus digunakan?

Regresi bertahap telah digunakan secara berlebihan dalam banyak makalah biomedis di masa lalu tetapi ini tampaknya membaik dengan pendidikan yang lebih baik dari banyak masalah. Namun banyak pengulas yang lebih tua masih memintanya. Bagaimana keadaan di mana regresi bertahap memiliki peran dan harus digunakan, jika ada?

13 regression multiple-regression feature-selection model-selection stepwise-regression

2

Mengapa menggunakan laso kelompok daripada laso?

Saya telah membaca bahwa grup laso digunakan untuk pemilihan variabel dan sparsity dalam kelompok variabel. Saya ingin tahu intuisi di balik klaim ini. Mengapa laso grup lebih disukai daripada laso? Mengapa jalur solusi laso grup tidak lurus linear?

13 regression feature-selection lasso regularization

1

Jelaskan langkah-langkah algoritma LLE (local linear embedding)?

Saya mengerti prinsip dasar di balik algoritma untuk LLE terdiri dari tiga langkah. Menemukan lingkungan setiap titik data dengan beberapa metrik seperti k-nn. Temukan bobot untuk setiap tetangga yang menunjukkan efek yang dimiliki tetangga pada titik data. Bangun penyisipan data dimensi rendah berdasarkan bobot yang dihitung. Tetapi penjelasan matematis dari …

13 machine-learning model-selection feature-selection dimensionality-reduction nonlinear

2

Kapan LASSO memilih prediktor yang berkorelasi?

Saya menggunakan paket 'lars' dalam R dengan kode berikut: > library(lars) > set.seed(3) > n <- 1000 > x1 <- rnorm(n) > x2 <- x1+rnorm(n)*0.5 > x3 <- rnorm(n) > x4 <- rnorm(n) > x5 <- rexp(n) > y <- 5*x1 + 4*x2 + 2*x3 + 7*x4 + rnorm(n) > …

13 correlation feature-selection lasso regularization ridge-regression

2

Menemukan fitur terbaik dalam model interaksi

Saya punya daftar protein dengan nilai fitur mereka. Tabel sampel terlihat seperti ini: ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 Baris adalah protein dan kolom adalah fitur. Saya juga punya daftar protein yang berinteraksi juga; sebagai contoh Protein3, Protein4 Protein1, Protein2 Protein4, Protein1 Masalah : Untuk analisis awal saya ingin tahu fitur …

13 machine-learning statistical-significance feature-selection networks

3

Distribusi probabilitas pengelompokan - metode & metrik?

Saya memiliki beberapa titik data, masing-masing berisi 5 vektor hasil diskrit diaglomerasi, setiap hasil vektor dihasilkan oleh distribusi yang berbeda, (jenis spesifik yang saya tidak yakin, tebakan terbaik saya adalah Weibull, dengan parameter bentuk bervariasi di sekitar eksponensial ke daya hukum (1 hingga 0, kurang lebih).) Saya mencari untuk menggunakan …

13 distributions clustering feature-selection kolmogorov-smirnov k-means

Pertanyaan yang diberi tag «feature-selection»