Definisi model dalam pembelajaran mesin


11

Ini definisi tidak cukup berlaku karena kita tidak selalu mengasumsikan distribusi yang mendasari. Jadi apa sebenarnya model itu? Bisakah GBM dengan hiperparameter tertentu dianggap sebagai model? Apakah model itu kumpulan aturan?


1
Anda bisa mengambil satu langkah lebih lanjut generik-ness dan melihat en.wikipedia.org/wiki/Mathematical_model - sebagian besar model ML akan cocok dengan definisi itu, bahkan jika mereka tidak cocok dengan "model statistik" (walaupun saya pikir hampir semua terlatih tanpa pengawasan atau model ML yang diawasi akan dianggap sebagai model statistik).
Neil Slater

Jawaban:


7

Saya tertarik pada pertanyaan yang sama baru-baru ini dan sampai pada kesadaran bahwa tidak ada definisi tunggal dari "model" dalam pembelajaran mesin. Ini sangat tergantung pada sumber yang Anda konsultasi, yang mungkin merupakan dokumentasi untuk program perangkat lunak tertentu, bahasa gaul yang diadopsi oleh komunitas penggunanya, atau definisi yang digunakan dalam makalah akademis yang diterbitkan, yang dapat sangat bervariasi dari jurnal ke jurnal. Selain itu, saya harus belajar untuk mengingat bahwa makalah tersebut ditulis tidak hanya oleh spesialis dalam pembelajaran mesin, tetapi oleh para ahli dalam disiplin ilmu lain yang memiliki kebutuhan untuk menerapkan teknik pembelajaran mesin (seperti pencitraan, berbagai bidang medis, dll.) . Banyak dari mereka tidak secara eksplisit mendefinisikan istilah "model," yang sering digunakan secara longgar. Berikut adalah beberapa definisi berbeda dari "model" I '

• Model statistik, khususnya statistik yang terkait dengan distribusi probabilitas.

• Data regresi dan statistik terkait.

• Model matematika seperti yang disebutkan oleh Neil Slater di atas.

• Model data yang digunakan dalam pembelajaran mesin, seperti kolom yang terlibat, tipe datanya, sumber data, dan metadata lainnya. Ini sangat sulit karena sama sekali tidak ada matematis tentang definisi ini, tidak seperti tiga yang pertama saya sebutkan. Sebagai contoh, lihat semua dokumentasi untuk SQL Server "model penambangan," yang melayani tugas ganda untuk tujuan pembelajaran mesin.

• Terkadang semua definisi di atas diperluas untuk mencakup struktur pembelajaran mesin yang dibangun di atas persamaan dan metadata, seperti spesifikasi jaring saraf. Dalam kasus lain, ini dianggap entitas yang terpisah.

Semua hal di atas terkadang dicampur dan dicocokkan bersama, tergantung pada sumbernya. Saya yakin ada definisi lain "model" yang saya tinggalkan dari daftar ini, yang akan memperumit masalah ini lebih jauh. Untuk menghadapi ambiguitas ini, saya mencoba melatih diri saya untuk memahami niat penulis setiap kali mereka menggunakan istilah "model." Terkadang mudah untuk menentukan berdasarkan konteks atau bidang tempat penulis bekerja, tetapi di lain waktu saya harus membaca secara mendalam sebuah artikel atau dokumentasi sebelum mengetahuinya. Saya berharap saya bisa lebih pasti tentang hal itu, tetapi itu benar-benar istilah yang kabur secara alami; tidak akan pernah ada jawaban sederhana untuk semua ini. Saya harap itu membantu.


1
Sementara istilah "model" mungkin berlaku untuk banyak hal, dalam konteks Machine Learning, model adalah artefak yang diciptakan melalui pembelajaran / pelatihan - misalnya dalam kasus jaringan saraf bobot dan bias dari jaringan itu.
Syzygy

5

Saya suka definisi Pembelajaran Mesin yang diberikan oleh Tom Mitchell .

Suatu program komputer dikatakan belajar dari pengalaman E sehubungan dengan beberapa kelas tugas T dan kinerja ukuran P jika kinerjanya pada tugas-tugas di T, yang diukur dengan P, meningkat dengan pengalaman E.

Jadi, mengingat definisi ini, saya harus mengatakan bahwa model adalah pengalaman yang diperoleh setelah melakukan beberapa kelas T.


Bukankah pengalaman E set pelatihan?
Itamar Mushkin

4

Dari artikel di Amazon Machine Learning

Proses pelatihan model ML melibatkan penyediaan algoritma ML (yaitu, algoritma pembelajaran) dengan data pelatihan untuk dipelajari. The term ML model refers to the model artifact that is created by the training process.


2

Model, secara longgar, adalah penyederhanaan dari beberapa hal atau proses. Misalnya, bentuk Bumi sebenarnya bukan bola, tetapi kita mungkin memperlakukannya sebagai bola bumi jika kita merancang bola dunia. Demikian pula, dengan asumsi alam semesta bersifat deterministik, ada beberapa proses alami yang menentukan apakah pelanggan akan membeli produk di situs web. Kami mungkin membangun sesuatu yang mendekati proses itu, yang dapat kami berikan beberapa informasi tentang pelanggan dan yang memberi tahu kami jika berpikir bahwa pelanggan akan membeli suatu produk.

"Model pembelajaran mesin", kemudian, adalah model yang dibangun oleh sistem pembelajaran mesin.

(Permintaan maaf untuk ini bukan jawaban yang keras, tapi saya harap ini masih berguna.)


1

Dalam paradigma pembelajaran mesin, model mengacu pada ekspresi matematis dari parameter model bersama dengan pemegang tempat input untuk masing-masing prediksi, kelas dan tindakan untuk kategori regresi, klasifikasi dan penguatan masing-masing.

Ekspresi ini tertanam dalam neuron tunggal sebagai model.

Untuk perceptron lapisan tunggal dan model pembelajaran dalam, kita perlu mengekstraksi model ini dengan hati-hati menggerakkan neuron dan lapisan untuk mengumpulkan dan menjahit fungsi aktivasi dengan cara yang teratur.


0

Dalam pembelajaran mesin, model adalah pusat gravitasi dan semuanya berputar di sekitar model. Walaupun orang yang berbeda memiliki definisi model yang berbeda. Namun menurut pendapat saya, inilah cara terbaik untuk mendefinisikan model "model dalam pembelajaran mesin adalah hipotesis yang mencoba menyesuaikan data dan belajar memprediksi data yang tidak terlihat".

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.