Saya seorang pendatang baru di pembelajaran Mesin (juga beberapa statistik), telah belajar pengetahuan (algoritma pembelajaran yang diawasi / tidak diawasi, metode optimasi yang relevan, regularisasi, beberapa filosofi (seperti trade-off bias-variance?)) Untuk sementara waktu. Saya tahu bahwa tanpa latihan nyata, saya tidak akan mendapatkan pemahaman yang mendalam tentang hal-hal pembelajaran mesin itu.
Jadi saya mulai dengan beberapa masalah klasifikasi dengan data nyata, katakanlah klasifikasi digit tulisan tangan (MNIST). Yang mengejutkan saya, tanpa pembelajaran fitur / rekayasa , akurasi mencapai 0,97 menggunakan random-forest classifier dengan nilai piksel mentah sebagai input. Saya juga mencoba algoritma pembelajaran lainnya, seperti SVM, LR dengan parameter yang sedang disetel.
Lalu saya tersesat, apakah itu terlalu mudah atau saya kehilangan sesuatu di sini? Cukup ambil algoritma pembelajaran dari toolkit dan sesuaikan beberapa parameter?
Jika itu semua tentang pembelajaran mesin dalam praktiknya, maka saya akan kehilangan minat dalam bidang ini. Saya berpikir dan membaca beberapa blog selama beberapa hari, dan saya sampai pada beberapa kesimpulan:
Bagian terpenting dari pembelajaran mesin dalam praktiknya adalah rekayasa fitur , yaitu, mengingat data, mengetahui representasi fitur yang lebih baik.
Algoritma pembelajaran mana yang digunakan juga penting, juga penyetelan parameter, tetapi pilihan terakhir lebih pada eksperimen.
Saya tidak yakin saya memahaminya dengan benar, berharap ada yang bisa memperbaiki saya dan memberi saya beberapa saran tentang pembelajaran mesin dalam prakteknya.