Mata pelajaran matematika apa yang akan Anda sarankan untuk persiapan penambangan data dan pembelajaran mesin?


30

Saya mencoba menyusun kurikulum matematika mandiri untuk mempersiapkan pembelajaran penambangan data dan pembelajaran mesin. Ini dimotivasi dengan memulai kelas pembelajaran mesin Andrew Ng di Coursera dan merasa bahwa sebelum melanjutkan saya perlu meningkatkan keterampilan matematika saya. Saya lulus dari perguruan tinggi beberapa saat yang lalu sehingga aljabar dan statistik saya (khususnya dari kelas ilmu politik / psikologi) berkarat.

Jawaban di utas Apakah latar belakang yang kuat dalam matematika merupakan persyaratan total untuk ML? hanya menyarankan buku atau kelas yang terkait langsung dengan pembelajaran mesin; Saya sudah melihat beberapa kelas dan buku-buku itu dan tidak tahu persis mata pelajaran matematika apa yang harus dipelajari (misalnya: bidang apa dari alamat matematika yang menurunkan persamaan untuk "meminimalkan fungsi biaya"?). Utas lainnya menyarankan ( Keterampilan & kursus perlu menjadi analis data ) hanya menyebutkan kategori luas keterampilan yang diperlukan untuk menganalisis data. Utas Pengantar statistik untuk ahli matematika tidak berlaku karena saya belum memiliki gelar dalam matematika; ahli matematika yang serupa menginginkan pengetahuan yang setara untuk tingkat statistik yang berkualitas memiliki daftar buku statistik yang luar biasa, tetapi sekali lagi, saya melihat memulai matematika dari ingatan aljabar yang berkarat dan bergerak naik dari sana.

Jadi, bagi mereka yang bekerja dalam pembelajaran mesin dan data mining, bidang matematika apa yang menurut Anda penting untuk melakukan pekerjaan Anda? Mata pelajaran matematika apa yang akan Anda sarankan untuk persiapan penambangan data dan pembelajaran mesin, dan dalam urutan apa? Inilah daftar dan pesanan yang saya miliki sejauh ini:

  • Aljabar
  • Pra-kalkulus
  • Kalkulus
  • Aljabar linier
  • Kemungkinan
  • Statistik (banyak sub-bidang berbeda di sini, tetapi tidak tahu bagaimana memecahnya)

Sedangkan untuk penambangan data dan pembelajaran mesin, melalui pekerjaan saya saat ini, saya memiliki akses ke catatan di situs web / aktivitas aplikasi, transaksi pelanggan / berlangganan, dan data real estat (baik statis maupun time-series). Saya berharap untuk menerapkan penambangan data dan pembelajaran mesin pada dataset ini.

Terima kasih!

EDIT:

Demi anak cucu, saya ingin berbagi penilaian mandiri matematika yang membantu untuk kelas Pengantar Mesin Pembelajaran Geoffrey Gordon dari Alex Smola di CMU.


3
Dalam hal prasyarat untuk kelas Coursera, info tersebut harus tersedia di suatu tempat di materi mereka. Di luar kelas mereka / lebih umum, pertanyaan tentang matematika apa yang Anda butuhkan untuk stat / ML / DM menurut saya sebagai duplikat. Ada beberapa utas pada CV yang membahas materi ini, termasuk: apakah-yang-kuat-latar belakang-dalam-matematika-a-syarat-untuk-ml , & keterampilan-kursus-diperlukan-untuk-menjadi-data-analis ( mungkin antara lain).
gung - Reinstate Monica

1
Harap tinjau utas tersebut, utas yang tertaut di sana terkait erat, & mungkin cari situs. Jika Anda masih memiliki pertanyaan setelah membaca, kembalilah ke sini & edit Q ini untuk membuatnya lebih khusus / tentukan lebih tepatnya apa yang masih perlu Anda ketahui yang tidak dibahas di tempat lain.
gung - Reinstate Monica

Jawaban:


15

Saran yang @gung buat tentu layak ditindaklanjuti. Setelah menyelesaikan kursus coursera, saya pikir daftar Anda adalah awal yang baik. Beberapa komentar:

  1. Aljabar linier dan aljabar matriks adalah hal yang sama, jadi jatuhkan aljabar.
  2. zxzy dzzxdzdx
  3. dalam kalkulus Anda tidak perlu apa pun di luar integrasi dasar (dan mungkin bahkan tidak itu). Ini beruntung karena integrasi itu sulit.
  4. tambahkan optimasi dasar, yaitu menemukan fungsi maksimum atau minimum, biasanya fungsi lebih dari satu variabel. Penghargaan gradient descent paling tidak sangat penting.
  5. dalam hal kesulitan Anda mungkin ingin berada di suatu tempat antara awal dan akhir tahun pertama sarjana.
  6. cobalah membaca beberapa teks probabilitas dan statistik dasar, online atau sebaliknya, tetapi jangan terlalu khawatir (matematika dasar adalah prasyarat untuk memahami probabilitas dan statistik). Jika Anda melakukan beberapa kursus seperti yang Anda sarankan Anda akan mencari tahu apa yang perlu Anda pelajari dan di mana minat Anda. Satu hal yang tidak ingin Anda lakukan, setidaknya pada awalnya, adalah menghabiskan banyak waktu belajar tentang pengujian hipotesis. Anda lebih suka mengarahkan untuk memahami statistik dasar - variabel acak, distribusi probabilitas (PFDs, CDFs), statistik deskriptif - dan kemudian mencoba memahami regresi.

5

Ada beberapa utas bagus di forum ini - termasuk SATU INI yang menurut saya sangat membantu bagi saya dalam hal mengembangkan garis besar konseptual keterampilan penting untuk pekerjaan ilmu data.

Seperti disebutkan di atas, ada banyak kursus online yang tersedia. Misalnya Coursera sekarang memiliki Spesialisasi Ilmu Data dengan sejumlah program yang mungkin akan mencakup beberapa alat yang Anda perlukan untuk pekerjaan Anda.


3

Jika Anda ingin melakukan pembelajaran mesin / penambangan data, saya akan sangat menyarankan optimasi / aljabar linier / statistik dan probabilitas. Berikut adalah daftar buku probabilitas. Semoga itu bisa membantu.


3

Sejauh menyikat keterampilan matematika yang sangat mendasar, saya menggunakan buku-buku ini:

Elemen Matematika untuk Ekonomi dan Keuangan. Mavron, Vassilis C., Phillips, Timothy N Buku-buku ini mencakup keterampilan matematika yang penting (penambahan substraksi), hingga diferensiasi parsial, integrasi, matriks dan penentu, dan bab kecil tentang optimasi, dan juga persamaan diferensial. Ini ditargetkan untuk ekonomi dan keuangan, tetapi ini adalah sebuah buku kecil, urutan bab yang sesuai dengan kebutuhan saya, dan mudah dibaca untuk saya.

Analisis Statistik: Microsoft Excel 2010. Conrad Carlberg Meliputi analisis statistik dasar, regresi berganda, dan analisis kovarian, dan menggunakan excel.

Menemukan Statistik Menggunakan R. Andy Field, Jeremy Miles, Zoë Field. Belum membacanya. Ini menggunakan R.

Aljabar Linier Dasar. Ron Larson, David C. Falvo.

Metode Matriks: Aljabar Linier Terapan Oleh Richard Bronson, Gabriel B. Costa. mencakup aljabar linier dasar dan kalkulus matriks

Itu adalah buku matematika dasar yang saya gunakan untuk berhubungan dengan penambangan data / pembelajaran mesin

Semoga ini membantu


3

Ada cukup banyak sumber daya yang relevan terdaftar (dan dikategorikan) di sini , di apa yang disebut "Open Source Data Science Masters".

Khusus untuk matematika mereka daftar:

  1. Aljabar & Pemrograman Linier
  2. Statistik
  3. Persamaan Diferensial & Kalkulus

Rekomendasi yang cukup umum, meskipun mereka mencantumkan beberapa buku pelajaran yang mungkin bermanfaat bagi Anda.


2
  • Probabilitas dan statistik sangat penting. Beberapa kata kunci adalah tes hipotesis, distribusi normal multivariat, inferensi Bayesian (probabilitas gabungan, probabilitas kondisional), rata-rata, varians, kovarians, divergensi Kullback-Leibler, ...
  • Aljabar linier dasar sangat penting untuk pembelajaran mesin. Topik yang bisa Anda pelajari adalah dekomposisi Eigen dan dekomposisi nilai singular. (Tentu saja Anda harus tahu cara menghitung produk matriks.)
  • Seperti yang sudah disebutkan TooTone: optimasi itu penting. Anda harus tahu apa itu gradient descent dan mungkin melihat metode Newton, Levenberg-Marquardt, Broyden-Fletcher-Goldfarb-Shanno.
  • Kalkulus tidak begitu penting tetapi mungkin berguna untuk mengetahui cara menghitung turunan parsial fungsi (matriks Jacobi, matriks Hesse, ...) dan Anda harus tahu apa yang integral.

0

Aljabar Linier, Statistik, Kalkulus. Saya pikir Anda dapat mempelajarinya bersama-sama w / ML - atau bahkan setelah dasar-dasar. Kursus-kursus awal / buku-buku melakukan pekerjaan yang baik dengan bab-bab primer matematika, dan Anda belajar hal-hal penting matematika sambil belajar ML. Saya membuat episode podcast tentang matematika yang Anda butuhkan untuk pembelajaran mesin, dan sumber daya untuk mempelajarinya: Panduan Pembelajaran Mesin # 8


0

Sebelum Memulai kursus pembelajaran mesin apa saja, ikuti kursus matematika berikut. Juga jangan mencoba menggali dalam upaya tunggal. Pelajari konsep dasar dan sekali lagi tingkatkan keterampilan matematika Anda dan ulangi: -

Topik Matematika adalah sebagai berikut: -

  • Aljabar linier
  • Kemungkinan
  • Kalkulus dasar
  • Maxima dan minimum fungsi
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.