Pertanyaan yang diberi tag «feature-construction»

Rekayasa fitur adalah proses menggunakan pengetahuan domain tentang data untuk membuat fitur untuk model pembelajaran mesin. Tag ini dimaksudkan untuk pertanyaan teoretis dan praktis tentang rekayasa fitur, tidak termasuk pertanyaan yang meminta kode, yang akan di luar topik di CrossValidated.

6
Cara berprinsip untuk mengecilkan variabel kategori dengan banyak tingkatan?
Teknik apa yang tersedia untuk mengelompokkan (atau mengelompokkan) banyak kategori menjadi beberapa, untuk tujuan menggunakannya sebagai input (prediktor) dalam model statistik? Pertimbangkan variabel seperti jurusan mahasiswa (disiplin yang dipilih oleh mahasiswa sarjana). Itu tidak teratur dan kategorikal, tetapi berpotensi memiliki lusinan tingkat yang berbeda. Katakanlah saya ingin menggunakan jurusan sebagai …

2
Autoencoder tidak dapat mempelajari fitur yang berarti
Saya memiliki 50.000 gambar seperti ini: Mereka menggambarkan grafik data. Saya ingin mengekstrak fitur dari gambar-gambar ini sehingga saya menggunakan kode autoencoder yang disediakan oleh Theano (deeplearning.net). Masalahnya adalah, autoencoder ini sepertinya tidak mempelajari fitur apa pun. Saya sudah mencoba RBM dan itu sama. Dataset MNIST menyediakan fitur yang bagus …

7
bagaimana cara merepresentasikan geografi atau kode pos dalam model pembelajaran mesin atau sistem rekomendasi?
Saya sedang membangun model dan saya pikir bahwa lokasi geografis cenderung sangat baik dalam memprediksi variabel target saya. Saya memiliki kode pos masing-masing pengguna saya. Saya tidak sepenuhnya yakin tentang cara terbaik untuk memasukkan kode pos sebagai fitur prediktor dalam model saya. Meskipun kode pos adalah angka, itu tidak berarti …

2
Bagaimana cara menginisialisasi elemen-elemen dari matriks filter?
Saya mencoba untuk lebih memahami jaringan saraf convolutional dengan menulis kode Python yang tidak bergantung pada perpustakaan (seperti Convnet atau TensorFlow), dan saya terjebak dalam literatur tentang bagaimana memilih nilai untuk matriks kernel, ketika melakukan lilitan pada suatu gambar. Saya mencoba memahami detail implementasi pada langkah antara fitur peta pada …

2
Kapan kita harus discretize / bin variabel independen terus menerus / fitur dan kapan tidak?
Kapan kita harus discretize / bin variabel independen / fitur dan kapan tidak? Upaya saya untuk menjawab pertanyaan: Secara umum, kita tidak boleh bin, karena binning akan kehilangan informasi. Binning sebenarnya meningkatkan derajat kebebasan model, jadi, dimungkinkan untuk menyebabkan over-fitting setelah binning. Jika kita memiliki model "bias tinggi", binning mungkin …

5
Mengapa fitur rekayasa bekerja?
Baru-baru ini saya telah belajar bahwa salah satu cara untuk menemukan solusi yang lebih baik untuk masalah ML adalah dengan membuat fitur. Seseorang dapat melakukannya dengan, misalnya, menjumlahkan dua fitur. Sebagai contoh, kami memiliki dua fitur "serangan" dan "pertahanan" semacam pahlawan. Kami kemudian membuat fitur tambahan yang disebut "total" yang …

2
Tutorial untuk rekayasa fitur
Seperti diketahui oleh semua, rekayasa fitur sangat penting untuk pembelajaran mesin, namun saya menemukan beberapa bahan yang terkait dengan bidang ini. Saya berpartisipasi dalam beberapa kompetisi di Kaggle dan percaya bahwa fitur yang baik bahkan mungkin lebih penting daripada klasifikasi yang baik dalam beberapa kasus. Adakah yang tahu tutorial tentang …

1
Apa itu "ruang fitur"?
Apa definisi "ruang fitur"? Misalnya, Saat membaca tentang SVM, saya membaca tentang "pemetaan ke fitur ruang". Saat membaca tentang CART, saya membaca tentang "partisi ke ruang fitur". Saya mengerti apa yang terjadi, terutama untuk CART, tetapi saya pikir ada beberapa definisi yang saya lewatkan. Apakah ada definisi umum "ruang fitur"? …



5
Apakah lebih baik melakukan analisis data eksplorasi hanya pada set data pelatihan?
Saya sedang melakukan analisis data eksplorasi (EDA) pada dataset. Kemudian saya akan memilih beberapa fitur untuk memprediksi variabel dependen. Pertanyaannya adalah: Apakah saya harus melakukan EDA hanya pada dataset pelatihan saya? Atau haruskah saya bergabung dengan pelatihan dan menguji kumpulan data kemudian melakukan EDA pada keduanya dan memilih fitur berdasarkan …



1
Ekstraksi kata kunci otomatis: menggunakan persamaan cosinus sebagai fitur
Saya punya matriks istilah-dokumen , dan sekarang saya ingin mengekstraksi kata kunci untuk setiap dokumen dengan metode pembelajaran yang dilindungi (SVM, Naif Bayes, ...). Dalam model ini, saya sudah menggunakan Tf-idf, tag Pos, ...M.M.M Tapi sekarang aku bertanya-tanya tentang selanjutnya. Saya punya matriks dengan persamaan cosinus antara istilah-istilah.CCC Apakah ada …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.