Jawaban:
Jika Anda menginginkan buku yang berorientasi pada aplikasi, pertimbangkan Pembelajaran Mesin Berbasis Model Christopher Bishop . Dia memiliki lebih banyak buku teknis yang dihormati.
Jika Anda mencari banyak kode, Pemrograman Probabilistik & Metode Bayesian untuk Peretas adalah sebuah opsi.
Buku lain pengantar dengan membungkuk lebih statistik adalah Sebuah Pengantar statistik Belajar dengan Aplikasi dalam R . Lagi-lagi, penulis memiliki versi teknis buku yang sangat dihormati.
Saya memiliki pertanyaan yang sama beberapa minggu yang lalu.
Saya pribadi menemukan Python O'Reilly untuk Analisis Data sangat berguna dalam mempelajari dasar-dasarnya. Buku ini mengasumsikan Anda memiliki pengalaman pemrograman python, tetapi juga memiliki lampiran di bagian belakang untuk mempelajari dasar-dasarnya.
Penulis memberi Anda berbagai contoh dunia nyata (bukan Monty Python) di awal yang dapat Anda buat dalam beberapa bab pertama, kemudian masuk ke detail tentang setiap hal saat buku berjalan, membangun pengetahuan Anda.
Saya menemukan instruksi sangat mudah dan langkah demi langkah. Profesor saya yang menjadi pemandu saya dalam semua ini terkesan betapa cepatnya saya belajar.
Saya juga telah mendengar hal-hal baik tentang Kaggle.
Ilmu Data di Awan dengan Microsoft Azure Machine Learning dan R adalah buku teks gratis yang bekerja melalui contoh dengan sangat rinci. Jangan tertunda oleh alat tertentu yang digunakan karena Anda tidak membutuhkannya untuk mendapatkan manfaat dari buku ini.
Satu lagi yang saya nikmati adalah Programming Collective Intelligence yang juga membahas sejumlah proyek secara terperinci, termasuk bagian pengikisan web yang sebagian besar buku tutupi.
Saya dapat merekomendasikan koleksi Notebook Ipython ini yang mencakup Ilmu Data, Statistik, dan Notebook yang dipelajari dengan Pembelajaran Mesin.
https://github.com/ipython/ipython/wiki/A-gallery-of- Interesting-IPython-Notebooks
Satu tempat Anda mungkin menemukan beberapa penjelasan langkah-demi-langkah yang menarik adalah tutorial Kaggle dan wawancara pemenang . Seringkali orang akan memposting ringkasan terperinci dari pendekatan mereka.
Salah satu buku terbaik yang saya temui adalah Machine Learning in Python dari Sebastian Raschka. Contoh mudah, penjelasan langkah demi langkah dan jumlah matematika yang tepat.
Struktur buku mencakup seluruh proses dari pembersihan data hingga ansambel dan evaluasi.
Lihatlah:
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
Ini memiliki tutorial langkah demi langkah yang akan memberi Anda gambaran tentang seluruh proses Eksplorasi Data, Analisis Data, dan Membangun model prediksi.
Penjelasan mengenai Eksplorasi Data dan Teknik Fitur (bagaimana memilih fitur yang relevan) ada di sini:
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
Lihat 5 Dataset pertama di sini yang memiliki tutorial dan mengerjakannya untuk mendapatkan pengalaman praktis:
Lihat juga di:
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
di mana ia menggunakan banyak model pada satu set data yang akan memberi Anda pemahaman tingkat dasar dari berbagai model.
Untuk memahami lebih lanjut tentang pemilihan model, lihat ini:
https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection
Tautan di atas memiliki jawaban yang diberikan oleh orang yang bekerja di lapangan.
Untuk mendapatkan wawasan tentang set data yang berbeda, Anda selalu dapat masuk ke kaggle dan mengikuti kompetisi dan melihat berbagai set data, di mana Anda memiliki akses ke kode orang di kernel. Forum-forum di Kaggle sangat membantu ketika orang-orang berdiskusi tentang penggunaan model yang berbeda untuk suatu masalah dan pendekatan mereka.