Apakah latar belakang yang kuat dalam matematika merupakan syarat total untuk ML? - jawaban dan spekulasi untuk ML dikonseptualisasikan sebagai statistik ;-)
Sekitar tahun 1990 saya memiliki harapan untuk aljabar komputer menjadi bantuan, saya pikir itu tetapi sangat terbatas. Tetapi tentu saja membantu dengan mempercepat pembelajaran matematika (kurang perlu mengembangkan keterampilan manipulasi dengan berlatih atau mencoba bertahan dengan hanya mampu melakukan latihan sederhana). Saya menemukan Aljabar Linear Fred Szabo dengan Mathematica contoh yang sangat baik tentang ini (tapi saya sudah mengambil kursus aljabar linier tingkat teori lanjut.)
Saya telah bekerja sejak 1988 (Menggunakan Metode Intensif Komputer untuk "Mengkonkretkan" Teorema dan Prinsip-prinsip dari Statistik - Tepatnya) untuk membuat jawaban tidak atau setidaknya tidak perlu (untuk statistik). Seseorang akan selalu dapat memahami lebih cepat dan lebih umum dengan keterampilan dan pemahaman matematika tambahan. Saya pikir saya sudah mulai dekat, tetapi orang membutuhkan representasi yang mampu memanipulasi model dan kesimpulan yang valid dan berguna untuk lebih dari sekedar masalah mainan.
Haruskah saya mencoba mengisi kekosongan matematika saya sebelum melanjutkan dengan ML?
Itu usaha keras - di MHO hampir semua orang yang memahami statistik sampai di sana dengan menjadi sangat nyaman memanipulasi standar dan terutama tidak begitu representasi matematis standar model probabilitas menghasilkan dan karakterisasi matematika inferensi (x% tertinggi dari statistik matematika Phds). Jadi bukan hanya mendapatkan dasar tetapi benar-benar nyaman dengan matematika. (Sebagai tambahan, bagi saya Teori Fourier sangat penting.)
Mengapa representasi ini sulit (bahkan dengan banyak matematika)?
Gerd Gigerenzer telah cukup banyak menetapkan bahwa tidak ada tantangan dengan penyakit sederhana positif / negatif yang diberikan tes positif / masalah negatif menggunakan frekuensi alami ". Referensi dari pertanyaan terkait tampaknya memanfaatkan http://www.autonlab.org/tutorials/prob18.pdf
Mengapa ini sulit digeneralisasikan?
Untuk tes k (diulang dan atau berbeda) - 2 ^ k
Untuk tes yang mengambil nilai v - v ^ k
Jadi untuk biner tidak diketahui - 2 * v ^ k probabilitas jalur sampel
Untuk p multiple binary tidak diketahui 2 ^ p * v ^ k
Untuk p multiple rasional tidak diketahui Q ^ p * v ^ k
Seseorang dengan cepat pindah ke matematika dengan jumlah tak terbatas yang tak terhitung dan tak terhitung untuk mengatasi hal ini, yang bahkan dengan keahlian matematika menyebabkan banyak kesalahpahaman dan paradoks yang tampak (misalnya paradoks Borel?)
Selain itu ada kesalahpahaman berbahaya linear ke non-linear (misalnya Bahaya Tersembunyi Menentukan Winbugs Prior Noninformatif Primer dan MCMC lainnya tanpa informasi untuk distribusi sebelumnya ) dan interaksi dan efek acak, dll.