Ada banyak tumpang tindih di antara ini, tetapi beberapa perbedaan dapat dibuat. Karena kebutuhan, saya harus terlalu menyederhanakan beberapa hal atau memberikan sedikit perhatian kepada orang lain, tetapi saya akan melakukan yang terbaik untuk memberikan pengertian tentang bidang-bidang ini.
Pertama, Kecerdasan Buatan cukup berbeda dari yang lain. AI adalah studi tentang cara membuat agen cerdas. Dalam praktiknya, ini adalah cara memprogram komputer untuk berperilaku dan melakukan tugas seperti yang akan dilakukan oleh agen cerdas (misalnya, seseorang). Ini tidak harus melibatkan pembelajaran atau induksi sama sekali, itu hanya bisa menjadi cara untuk 'membangun perangkap tikus yang lebih baik'. Misalnya, aplikasi AI telah memasukkan program untuk memantau dan mengontrol proses yang sedang berlangsung (misalnya, tingkatkan aspek A jika tampaknya terlalu rendah). Perhatikan bahwa AI dapat mencakup sangat dekat apa pun yang dilakukan mesin, asalkan tidak melakukannya dengan 'bodoh'.
Namun dalam praktiknya, sebagian besar tugas yang membutuhkan kecerdasan memerlukan kemampuan untuk membujuk pengetahuan baru dari pengalaman. Dengan demikian, area luas dalam AI adalah pembelajaran mesin . Suatu program komputer dikatakan mempelajari beberapa tugas dari pengalaman jika kinerjanya pada tugas tersebut meningkat dengan pengalaman, menurut beberapa ukuran kinerja. Pembelajaran mesin melibatkan studi tentang algoritma yang dapat mengekstraksi informasi secara otomatis (yaitu, tanpa panduan manusia online). Memang benar bahwa beberapa dari prosedur ini memasukkan ide-ide yang berasal langsung dari, atau diilhami oleh, statistik klasik, tetapi mereka tidak memilikinyamenjadi. Demikian pula untuk AI, pembelajaran mesin sangat luas dan dapat mencakup hampir semua, asalkan ada beberapa komponen induktif untuk itu. Contoh dari algoritma pembelajaran mesin mungkin adalah filter Kalman.
Penambangan data adalah bidang yang telah mengambil banyak inspirasi dan teknik dari pembelajaran mesin (dan beberapa, juga, dari statistik), tetapi diletakkan untuk tujuan yang berbeda . Penambangan data dilakukan oleh seseorang , dalam situasi tertentu, pada set data tertentu, dengan tujuan dalam pikiran. Biasanya, orang ini ingin memanfaatkan kekuatan berbagai teknik pengenalan pola yang telah dikembangkan dalam pembelajaran mesin. Seringkali, kumpulan data bersifat masif , rumit , dan / atau mungkin memiliki masalah khusus(seperti ada lebih banyak variabel daripada pengamatan). Biasanya, tujuannya adalah untuk menemukan / menghasilkan beberapa wawasan awal di daerah di mana hanya ada sedikit pengetahuan sebelumnya, atau untuk dapat memprediksi pengamatan di masa depan secara akurat. Selain itu, prosedur penambangan data dapat berupa 'tidak diawasi' (kami tidak tahu jawabannya - penemuan) atau 'diawasi' (kami tahu jawabannya - prediksi). Perhatikan bahwa tujuannya umumnya bukan untuk mengembangkan pemahaman yang lebih canggih tentang proses pembuatan data yang mendasarinya. Teknik penambangan data umum akan mencakup analisis klaster, pohon klasifikasi dan regresi, dan jaringan saraf.
Saya kira saya tidak perlu banyak bicara untuk menjelaskan statistik apa yang ada di situs ini, tapi mungkin saya bisa mengatakan beberapa hal. Statistik klasik (di sini yang saya maksud adalah sering dan Bayesian) adalah sub-topik dalam matematika. Saya menganggapnya sebagai persimpangan sebagian besar dari apa yang kita ketahui tentang probabilitas dan apa yang kita ketahui tentang optimasi. Meskipun statistik matematika dapat dipelajari hanya sebagai objek penyelidikan Platonis, sebagian besar dipahami sebagai lebih praktis dan diterapkan dalam karakter daripada bidang matematika lainnya yang lebih jarang. Karena itu (dan sangat berbeda dengan penambangan data di atas), sebagian besar digunakan untuk lebih memahami beberapa proses menghasilkan data tertentu. Jadi, biasanya dimulai dengan model yang ditentukan secara formal, dan dari sini didapat prosedur untuk mengekstraksi model itu secara akurat dari contoh bising (yaitu, estimasi - dengan mengoptimalkan beberapa fungsi kerugian) dan untuk dapat membedakannya dari kemungkinan lain (yaitu, kesimpulan berdasarkan sifat yang diketahui dari distribusi sampel). Teknik statistik prototipikal adalah regresi.