Ketika saya menemukan pembelajaran mesin, saya melihat berbagai teknik menarik seperti:
- secara otomatis menyesuaikan algoritma dengan teknik seperti
grid search
, - mendapatkan hasil yang lebih akurat melalui kombinasi berbagai algoritma dari "tipe" yang sama, yaitu
boosting
, - mendapatkan hasil yang lebih akurat melalui kombinasi algoritma yang berbeda (tetapi bukan jenis algoritma yang sama), itu
stacking
, - dan mungkin masih banyak lagi yang harus saya temukan ...
Pertanyaan saya adalah sebagai berikut: ada semua bagian itu. Tetapi apakah mungkin untuk menyatukan mereka untuk membuat algoritma yang mengambil sebagai input data yang dibersihkan dan menghasilkan hasil yang baik dengan mengambil yang terbaik dari semua teknik? (Tentu saja itu mungkin akan menjadi kurang efisien jika seorang ilmuwan data profesional, tetapi dia akan lebih baik daripada saya!) Jika ya, apakah Anda memiliki kode sampel atau Anda tahu kerangka kerja yang bisa melakukan itu?
EDIT: Setelah beberapa jawaban, tampaknya beberapa penyempitan harus dilakukan. Mari kita ambil contoh, kita memiliki satu kolom dengan data kategorikal, sebut saja y
dan kita ingin memprediksinya dari data numerik X
yang berupa boneka atau data numerik nyata (tinggi, suhu). Kami menganggap pembersihan telah dilakukan sebelumnya. Adakah algoritma yang ada yang dapat mengambil data dan menghasilkan prediksi? (dengan menguji beberapa algoritme, menyetelnya, meningkatkan, dll.) Jika ya, apakah ini efisien secara komputasi (apakah perhitungan dilakukan dalam waktu yang wajar jika kita dibandingkan dengan algoritma normal), dan apakah Anda memiliki contoh kode?
auto.arima
(dari forecast
perpustakaan) bisa lebih baik daripada manusia - Rob Hyndman disebutkan dalam beberapa kali dalam presentasinya. Jadi ada area di mana beberapa jenis "pembelajaran otomatis" diterapkan dengan sukses.