Daftar teknik teknik fitur


Jawaban:


10

Tidak ada sumber pasti tentang cara melakukan rekayasa fitur. Ini sering tergantung pada masalah yang Anda coba selesaikan. Ada yang bilang itu lebih dari seni daripada sains.

Tapi saya akan pergi melalui beberapa kernel kaggle skor tinggi / solusi menang jika tersedia. Langsung saja ke kaggle dan telusuri kompetisi. Ada banyak bahan yang sangat berguna di sana.

Juga jurnal penelitian pembelajaran mesin memiliki banyak makalah tentang rekayasa fitur. Cukup cari di situs mereka http://www.jmlr.org/ .

Tautan berikut berguna dan panjang lebar untuk diparafrasekan:

  • Beberapa informasi tentang beberapa praktik terbaik rekayasa fitur dapat ditemukan di Quora, lihat tautan ini
  • Di penguasaan pembelajaran mesin ada halaman ini tentang rekayasa fitur.

3

Imputasi Data Tidak Ada:

  1. Analisis kasus lengkap

  2. Mean / Median / Mode imputasi

  3. Imputasi Sampel Acak

  4. Penggantian dengan Nilai Sewenang-wenang

  5. Indikator Nilai Hilang

  6. Imputasi multivarian

Pengkodean Kategori:

  1. Satu pengkodean panas

  2. Hitung dan Frekuensi pengkodean

  3. Pengkodean target / Pengkodean rata-rata

  4. Pengkodean ordinal

  5. Berat Bukti

  6. Pengodean label langka

  7. BaseN, hashing fitur dan lainnya

Transformasi Variabel:

  1. Logaritma

  2. Timbal-balik

  3. Akar pangkat dua

  4. Eksponensial

  5. Yeo-Johnson

  6. Kotak-Cox

Diskritisasi:

  1. Diskritisasi frekuensi yang sama

  2. Diskritisasi panjang yang sama

  3. Diskresi dengan pohon

  4. Diskresi dengan ChiMerge

Penghapusan Outlier:

  1. Menghapus outlier

  2. Memperlakukan outlier sebagai NaN

  3. Pembatasan, Windsorisation

Penskalaan fitur:

  1. Standardisasi

  2. Penskalaan MinMax

  3. Scaling Berarti

  4. Max Scaling Mutlak

  5. Unit Norm-Scaling

Rekayasa Tanggal dan Waktu:

  1. Ekstraksi hari, bulan, tahun, kuartal, waktu berlalu

Pembuatan fitur:

  1. Jumlah, pengurangan, rata-rata, minimum, maks, produk, hasil bagi sekelompok fitur

Data Transaksi Agregat:

  1. Sama seperti di atas tetapi dalam fitur yang sama dari jendela waktu

Mengekstrak fitur dari teks:

  1. Tas kata-kata

  2. tfidf

  3. n-gram

  4. word2vec

  5. ekstraksi topik

Dan akhirnya mengekstraksi fitur dari gambar.

Artikel bagus yang menggambarkan sebagian besar teknik di atas: Rekayasa Fitur tinjauan komprehensif

Daftar sumber daya yang baik untuk mempelajari lebih lanjut tentang rekayasa fitur: Sumber Daya Terbaik untuk belajar tentang rekayasa fitur

Alat Python untuk rekayasa fitur dapat ditemukan di utas ini

PENOLAKAN: Saya menulis 2 artikel, dan saya juga pencipta 1 program yang direkomendasikan untuk belajar tentang rekayasa fitur.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.