Seperti yang ditunjukkan oleh komentar pada pertanyaan Anda, ada banyak orang yang berupaya menemukan sesuatu yang lebih baik. Saya ingin menjawab pertanyaan ini dengan memperluas komentar yang ditinggalkan oleh @josh
Semua model salah tetapi ada pula yang berguna (Wiki)
Pernyataan di atas adalah kebenaran umum yang digunakan untuk menggambarkan sifat model statistik. Dengan menggunakan data yang kami miliki, kami dapat membuat model yang memungkinkan kami melakukan hal-hal berguna seperti perkiraan nilai yang diprediksi.
Ambil contoh Regresi Linier
Dengan menggunakan sejumlah pengamatan, kita dapat menyesuaikan suatu model untuk memberi kita nilai perkiraan untuk variabel dependen yang memberikan nilai apa pun untuk variabel independen.
Burnham, KP; Anderson, DR (2002), Pemilihan Model dan Multimodel> Inferensi: Pendekatan Informasi-Teoretis Praktis (edisi kedua):
"Sebuah model adalah penyederhanaan atau perkiraan realitas dan karenanya tidak akan mencerminkan semua kenyataan. ... Box mencatat bahwa" semua model salah, tetapi beberapa berguna. "Sementara model tidak pernah bisa menjadi" kebenaran, "sebuah model mungkin peringkat dari sangat berguna, berguna, agak berguna untuk, akhirnya, pada dasarnya tidak berguna. "
Penyimpangan dari model kami (seperti yang dapat dilihat pada gambar di atas) tampak acak, beberapa pengamatan di bawah garis dan beberapa di atas, tetapi garis regresi kami menunjukkan korelasi umum. Sementara penyimpangan dalam model kami tampak acak, dalam skenario realistis akan ada faktor lain yang berperan yang menyebabkan penyimpangan ini. Sebagai contoh, bayangkan menonton mobil ketika mereka melewati persimpangan di mana mereka harus berbelok ke kiri atau ke kanan untuk melanjutkan, mobil-mobil berbelok tanpa pola tertentu. Sementara kita dapat mengatakan bahwa arah belokan mobil benar-benar acak, apakah setiap pengemudi mencapai persimpangan dan pada saat itu membuat keputusan acak ke arah mana untuk berbelok? Pada kenyataannya mereka mungkin menuju ke suatu tempat tertentu karena alasan tertentu, dan tanpa berusaha menghentikan setiap mobil untuk menanyakan alasan mereka, kita hanya dapat menggambarkan tindakan mereka secara acak.
Di mana kita dapat menyesuaikan model dengan deviasi minimal, seberapa yakinkah kita bahwa variabel yang tidak diketahui, tidak diketahui atau tak terukur pada suatu saat melempar model kita? Apakah kepakan sayap kupu-kupu di Brasil memicu tornado di Texas?
Masalah dengan menggunakan model Linear dan SVN yang Anda sebutkan sendiri adalah bahwa kami agak diminta untuk mengamati variabel kami secara manual dan bagaimana masing-masing memengaruhi satu sama lain. Kita kemudian perlu memutuskan variabel apa yang penting dan menulis algoritma tugas khusus. Ini bisa langsung jika kita hanya memiliki beberapa variabel, tetapi bagaimana jika kita memiliki ribuan? Bagaimana jika kita ingin membuat model pengenalan gambar umum, dapatkah ini dicapai secara realistis dengan pendekatan ini?
Pembelajaran Jauh dan Jaringan Saraf Tiruan (JST) dapat membantu kami membuat model yang berguna untuk kumpulan data besar yang berisi variabel dalam jumlah sangat besar (mis. Pustaka gambar). Seperti yang Anda sebutkan, ada sejumlah solusi yang tidak dapat dipahami yang dapat cocok dengan data menggunakan JST, tetapi apakah angka ini benar-benar berbeda dengan jumlah solusi yang perlu kita kembangkan melalui trial and error?
Aplikasi JST melakukan banyak pekerjaan untuk kita, kita dapat menentukan input dan output yang kita inginkan (dan mengubahnya kemudian untuk melakukan perbaikan) dan menyerahkannya kepada JST untuk mencari solusinya. Inilah sebabnya mengapa JST sering digambarkan sebagai "kotak hitam" . Dari input yang diberikan mereka menghasilkan perkiraan, namun (secara umum) perkiraan ini tidak termasuk rincian tentang bagaimana mereka diperkirakan.
Dan itu benar-benar turun ke masalah apa yang Anda coba selesaikan, karena masalahnya akan menentukan pendekatan model apa yang lebih berguna. Model tidak sepenuhnya akurat sehingga selalu ada unsur 'salah', namun semakin akurat hasil Anda, semakin berguna model itu. Memiliki lebih banyak detail dalam hasil tentang bagaimana perkiraan itu dibuat mungkin juga berguna, tergantung pada masalahnya bahkan mungkin lebih berguna daripada peningkatan akurasi.
Jika misalnya Anda menghitung skor kredit seseorang, menggunakan regresi dan SVM memberikan perhitungan yang dapat dieksplorasi lebih baik. Mampu men-tweak model secara langsung dan menjelaskan kepada pelanggan pengaruh variabel independen terpisah terhadap skor keseluruhan mereka sangat berguna. ANN dapat membantu dalam memproses jumlah variabel yang lebih besar untuk mencapai skor yang lebih akurat, tetapi apakah akurasi ini lebih berguna?