Jawaban:
Karena Anda mengajukan pertanyaan yang sangat mendasar ini, sepertinya layak untuk menentukan apa itu Pembelajaran Mesin itu sendiri.
Machine Learning adalah kelas algoritma yang digerakkan oleh data, yaitu tidak seperti algoritma "normal", itu adalah data yang "memberi tahu" apa "jawaban yang baik". Contoh: algoritma pembelajaran non-mesin hipotetis untuk deteksi wajah dalam gambar akan mencoba untuk mendefinisikan apa wajah itu (disk bundar seperti kulit, dengan area gelap di mana Anda mengharapkan mata, dll). Algoritma pembelajaran mesin tidak akan memiliki definisi kode seperti itu, tetapi akan "belajar-dengan-contoh": Anda akan menunjukkan beberapa gambar wajah dan bukan-wajah dan algoritma yang baik pada akhirnya akan belajar dan dapat memprediksi apakah tidak terlihat atau tidak. gambar adalah wajah.
Contoh khusus deteksi wajah ini diawasi , yang berarti bahwa contoh Anda harus diberi label , atau secara eksplisit mengatakan wajah mana dan mana yang tidak.
Dalam algoritma tanpa pengawasan, contoh Anda tidak diberi label , misalnya Anda tidak mengatakan apa-apa. Tentu saja, dalam kasus seperti itu algoritma itu sendiri tidak dapat "menemukan" apa wajah itu, tetapi ia dapat mencoba mengelompokkan data menjadi kelompok-kelompok yang berbeda, misalnya ia dapat membedakan bahwa wajah sangat berbeda dari lanskap, yang sangat berbeda dari kuda.
Karena jawaban lain menyebutkannya (meskipun, dengan cara yang salah): ada bentuk pengawasan "menengah", yaitu pembelajaran semi-diawasi dan aktif . Secara teknis, ini adalah metode yang diawasi di mana ada beberapa cara "pintar" untuk menghindari sejumlah besar contoh berlabel. Dalam pembelajaran aktif, algoritme itu sendiri yang memutuskan hal mana yang harus Anda beri label (mis. Itu bisa sangat yakin tentang lanskap dan kuda, tetapi mungkin meminta Anda untuk mengkonfirmasi apakah gorila memang gambar wajah). Dalam pembelajaran semi-terawasi, ada dua algoritma berbeda yang dimulai dengan contoh yang diberi label, dan kemudian "saling memberi tahu" cara mereka berpikir tentang sejumlah besar data yang tidak berlabel. Dari "diskusi" ini mereka belajar.
Pembelajaran terawasi adalah ketika data yang Anda berikan algoritmenya "ditandai" atau "berlabel", untuk membantu logika Anda mengambil keputusan.
Contoh: Bayes filtering spam, di mana Anda harus menandai item sebagai spam untuk menyaring hasilnya.
Pembelajaran tanpa pengawasan adalah jenis algoritma yang mencoba menemukan korelasi tanpa input eksternal selain dari data mentah.
Contoh: algoritma pengelompokan data mining.
Aplikasi di mana data pelatihan terdiri dari contoh vektor input bersama dengan vektor target yang sesuai dikenal sebagai masalah pembelajaran yang diawasi.
Dalam masalah pengenalan pola lainnya, data pelatihan terdiri dari sekumpulan vektor input x tanpa nilai target yang sesuai. Tujuan dalam masalah pembelajaran yang tidak diawasi seperti itu mungkin untuk menemukan kelompok-kelompok contoh serupa dalam data, di mana itu disebut pengelompokan
Pengenalan Pola dan Pembelajaran Mesin (Bishop, 2006)
Dalam pembelajaran yang diawasi, input x
diberikan dengan hasil yang diharapkan y
(yaitu, output yang seharusnya dihasilkan model ketika input tersebut x
), yang sering disebut "kelas" (atau "label") dari input yang sesuai x
.
Dalam pembelajaran tanpa pengawasan, "kelas" contoh x
tidak disediakan. Jadi, pembelajaran tanpa pengawasan dapat dianggap sebagai menemukan "struktur tersembunyi" dalam kumpulan data yang tidak berlabel.
Pendekatan untuk pembelajaran yang diawasi meliputi:
Klasifikasi (1R, Naif Bayes, algoritma pembelajaran pohon keputusan, seperti ID3 CART, dan sebagainya)
Prediksi Nilai Numerik
Pendekatan pembelajaran tanpa pengawasan meliputi:
Clustering (K-means, hierarchical clustering)
Belajar Peraturan Asosiasi
Misalnya, sangat sering melatih jaringan saraf diawasi pembelajaran: Anda memberi tahu jaringan yang kelasnya sesuai dengan vektor fitur yang Anda makan.
Clustering adalah pembelajaran tanpa pengawasan: Anda membiarkan algoritma memutuskan bagaimana mengelompokkan sampel ke dalam kelas yang berbagi properti umum.
Contoh lain dari pembelajaran tanpa pengawasan adalah peta yang disusun sendiri oleh Kohonen .
Saya bisa memberi contoh kepada Anda.
Misalkan Anda perlu mengenali kendaraan mana yang merupakan mobil dan mana yang merupakan sepeda motor.
Dalam kasus pembelajaran yang diawasi , dataset input (pelatihan) Anda perlu diberi label, yaitu, untuk setiap elemen input dalam dataset input (pelatihan) Anda, Anda harus menentukan apakah itu mewakili mobil atau sepeda motor.
Dalam kasus pembelajaran tanpa pengawasan , Anda tidak memberi label pada input. Model yang tidak diawasi mengelompokkan input ke dalam kelompok berdasarkan misalnya pada fitur / properti yang serupa. Jadi, dalam hal ini, tidak ada label seperti "mobil".
Pembelajaran terawasi
Pembelajaran terawasi didasarkan pada pelatihan sampel data dari sumber data dengan klasifikasi yang benar sudah ditugaskan. Teknik tersebut digunakan dalam model feedforward atau MultiLayer Perceptron (MLP). MLP ini memiliki tiga karakteristik berbeda:
Karakteristik ini bersama dengan belajar melalui pelatihan memecahkan masalah yang sulit dan beragam. Belajar melalui pelatihan dalam model JST yang diawasi juga disebut sebagai algoritma backpropagation kesalahan. Algoritma pembelajaran koreksi kesalahan melatih jaringan berdasarkan sampel input-output dan menemukan sinyal kesalahan, yang merupakan perbedaan dari output yang dihitung dan output yang diinginkan dan menyesuaikan bobot sinaptik dari neuron yang sebanding dengan produk kesalahan. sinyal dan instance input dari bobot sinaptik. Berdasarkan prinsip ini, pembelajaran propagasi kesalahan kembali terjadi dalam dua lintasan:
Forward Pass:
Di sini, vektor input disajikan ke jaringan. Sinyal input ini merambat maju, neuron demi neuron melalui jaringan dan muncul di ujung output jaringan sebagai sinyal output: di y(n) = φ(v(n))
mana v(n)
medan lokal yang diinduksi dari neuron didefinisikan oleh v(n) =Σ w(n)y(n).
Output yang dihitung pada layer output o (n) adalah dibandingkan dengan respons yang diinginkan d(n)
dan menemukan kesalahan e(n)
untuk neuron itu. Bobot sinaptik jaringan selama pass ini tetap sama.
Backward Pass:
Sinyal kesalahan yang berasal dari neuron keluaran lapisan itu disebarkan ke belakang melalui jaringan. Ini menghitung gradien lokal untuk setiap neuron di setiap lapisan dan memungkinkan bobot sinaptik jaringan untuk mengalami perubahan sesuai dengan aturan delta sebagai:
Δw(n) = η * δ(n) * y(n).
Perhitungan rekursif ini dilanjutkan, dengan meneruskan maju diikuti oleh melewati mundur untuk setiap pola input sampai jaringan terkonvergensi.
Paradigma pembelajaran yang diawasi oleh JST adalah efisien dan menemukan solusi untuk beberapa masalah linear dan non-linear seperti klasifikasi, kontrol pabrik, peramalan, prediksi, robotika dll.
Pembelajaran tanpa pengawasan
Self-Organizing neural networks belajar menggunakan algoritma belajar tanpa pengawasan untuk mengidentifikasi pola-pola tersembunyi dalam data input tidak berlabel. Tanpa pengawasan ini mengacu pada kemampuan untuk mempelajari dan mengatur informasi tanpa memberikan sinyal kesalahan untuk mengevaluasi solusi potensial. Kurangnya arah untuk algoritma pembelajaran dalam pembelajaran tanpa pengawasan kadang-kadang bisa menguntungkan, karena memungkinkan algoritma untuk melihat kembali pola-pola yang belum dipertimbangkan sebelumnya. Karakteristik utama dari Self-Organizing Maps (SOM) adalah:
Lapisan komputasi juga disebut sebagai lapisan kompetitif karena neuron dalam lapisan saling bersaing untuk menjadi aktif. Oleh karena itu, algoritma pembelajaran ini disebut algoritma kompetitif. Algoritma yang tidak diawasi dalam SOM bekerja dalam tiga fase:
Fase kompetisi:
untuk setiap pola input x
, disajikan ke jaringan, produk dalam dengan berat sinaptik w
dihitung dan neuron pada lapisan kompetitif menemukan fungsi diskriminan yang mendorong persaingan antara neuron dan vektor bobot sinaptik yang dekat dengan vektor input dalam jarak Euclidean diumumkan sebagai pemenang dalam kompetisi. Neuron itu disebut neuron yang paling cocok,
i.e. x = arg min ║x - w║.
Fase koperasi:
neuron yang menang menentukan pusat lingkungan topologis h
dari neuron yang bekerja sama. Ini dilakukan oleh interaksi lateral d
antara neuron kooperatif. Lingkungan topologis ini mengurangi ukurannya selama periode waktu tertentu.
Fase adaptif:
memungkinkan neuron pemenang dan neuron tetangganya untuk meningkatkan nilai individual mereka dari fungsi diskriminan dalam kaitannya dengan pola input melalui penyesuaian berat sinaptik yang sesuai,
Δw = ηh(x)(x –w).
Setelah presentasi berulang dari pola pelatihan, vektor bobot sinaptik cenderung mengikuti distribusi pola input karena pembaruan lingkungan dan dengan demikian JST belajar tanpa pengawas.
Self-Organizing Model secara alami mewakili perilaku neuro-biologis, dan karenanya digunakan dalam banyak aplikasi dunia nyata seperti pengelompokan, pengenalan suara, segmentasi tekstur, pengkodean vektor dll.
Saya selalu menemukan perbedaan antara belajar tanpa pengawasan dan supervisi menjadi sewenang-wenang dan sedikit membingungkan. Tidak ada perbedaan nyata antara kedua kasus, sebaliknya ada berbagai situasi di mana suatu algoritma dapat memiliki lebih atau kurang 'pengawasan'. Keberadaan pembelajaran semi-diawasi adalah contoh nyata di mana garis menjadi kabur.
Saya cenderung menganggap pengawasan sebagai memberikan umpan balik kepada algoritma tentang solusi apa yang harus disukai. Untuk pengaturan tradisional yang diawasi, seperti deteksi spam, Anda memberi tahu algoritma "jangan membuat kesalahan pada set pelatihan" ; untuk pengaturan tradisional tanpa pengawasan, seperti pengelompokan, Anda memberi tahu algoritme "titik-titik yang dekat satu sama lain harus berada dalam satu cluster yang sama" . Kebetulan, bentuk umpan balik pertama jauh lebih spesifik daripada yang terakhir.
Singkatnya, ketika seseorang berkata 'diawasi', pikirkan klasifikasi, ketika mereka mengatakan 'tidak diawasi' mengelompokkan dan mencoba untuk tidak terlalu khawatir tentang hal itu di luar itu.
Pembelajaran mesin: Ini mengeksplorasi studi dan konstruksi algoritma yang dapat belajar dari dan membuat prediksi pada data. Algoritma tersebut beroperasi dengan membangun model dari input contoh untuk membuat prediksi atau keputusan yang didorong data dinyatakan sebagai output, daripada mengikuti statis ketat instruksi program.
Pembelajaran terawasi: Ini adalah tugas pembelajaran mesin untuk menyimpulkan suatu fungsi dari data pelatihan berlabel. Data pelatihan terdiri dari serangkaian contoh pelatihan. Dalam pembelajaran terawasi, setiap contoh adalah pasangan yang terdiri dari objek input (biasanya vektor) dan nilai output yang diinginkan (juga disebut sinyal pengawas). Algoritma pembelajaran yang diawasi menganalisis data pelatihan dan menghasilkan fungsi yang disimpulkan, yang dapat digunakan untuk memetakan contoh-contoh baru.
Komputer disajikan dengan input contoh dan output yang diinginkan, diberikan oleh "guru", dan tujuannya adalah untuk mempelajari aturan umum yang memetakan input ke output. Secara khusus, algoritma pembelajaran yang diawasi mengambil set data input dan respons yang dikenal. ke data (output), dan melatih model untuk menghasilkan prediksi yang masuk akal untuk respons terhadap data baru.
Pembelajaran tanpa pengawasan: Belajar tanpa guru. Satu hal dasar yang mungkin ingin Anda lakukan dengan data adalah memvisualisasikannya. Ini adalah tugas pembelajaran mesin menyimpulkan fungsi untuk menggambarkan struktur tersembunyi dari data yang tidak berlabel. Karena contoh yang diberikan kepada pelajar tidak berlabel, tidak ada sinyal kesalahan atau hadiah untuk mengevaluasi solusi potensial. Ini membedakan pembelajaran tanpa pengawasan dari pembelajaran dengan pengawasan. Pembelajaran tanpa pengawasan menggunakan prosedur yang berusaha untuk menemukan partisi alami dari pola.
Dengan pembelajaran tanpa pengawasan tidak ada umpan balik berdasarkan hasil prediksi, yaitu, tidak ada guru untuk mengoreksi Anda. Di bawah metode pembelajaran Tanpa pengawasan tidak ada contoh berlabel yang disediakan dan tidak ada gagasan tentang output selama proses pembelajaran. Akibatnya, tergantung pada skema / model pembelajaran untuk menemukan pola atau menemukan kelompok data input
Anda harus menggunakan metode pembelajaran tanpa pengawasan ketika Anda membutuhkan sejumlah besar data untuk melatih model Anda, dan kemauan dan kemampuan untuk bereksperimen dan mengeksplorasi, dan tentu saja tantangan yang tidak terpecahkan dengan baik melalui metode yang lebih mapan. Dengan belajar tanpa pengawasan itu adalah mungkin untuk mempelajari model yang lebih besar dan lebih kompleks daripada dengan pembelajaran yang diawasi. Ini contoh yang bagus
.
Pembelajaran terawasi: katakanlah seorang anak pergi ke taman kinder. di sini guru menunjukkan kepadanya 3 mainan-rumah, bola dan mobil. sekarang guru memberinya 10 mainan. ia akan mengklasifikasikannya dalam 3 kotak rumah, bola, dan mobil berdasarkan pengalamannya sebelumnya. jadi anak pertama kali diawasi oleh guru untuk mendapatkan jawaban yang benar untuk beberapa set. kemudian dia diuji pada mainan yang tidak dikenal.
Pembelajaran tanpa pengawasan: contoh TK lagi. Seorang anak diberikan 10 mainan. dia disuruh menggolongkan yang serupa. jadi berdasarkan fitur seperti bentuk, ukuran, warna, fungsi dll dia akan mencoba membuat 3 kelompok mengatakan A, B, C dan kelompokkan mereka.
Kata Supervise berarti Anda memberikan pengawasan / instruksi kepada mesin untuk membantunya menemukan jawaban. Setelah mempelajari instruksi, ia dapat dengan mudah memprediksi kasus baru.
Tanpa pengawasan berarti tidak ada pengawasan atau instruksi bagaimana menemukan jawaban / label dan mesin akan menggunakan kecerdasannya untuk menemukan beberapa pola dalam data kami. Di sini ia tidak akan membuat prediksi, itu hanya akan mencoba untuk menemukan kelompok yang memiliki data serupa.
Ada banyak jawaban yang menjelaskan perbedaan secara rinci. Saya menemukan gif ini pada codeacademy dan mereka sering membantu saya menjelaskan perbedaan secara efektif.
Perhatikan bahwa gambar pelatihan memiliki label di sini dan model tersebut mempelajari nama-nama gambar tersebut.
Perhatikan bahwa apa yang dilakukan di sini hanya pengelompokan (clustering) dan bahwa model tidak tahu apa-apa tentang gambar apa pun.
Algoritma pembelajaran jaringan saraf dapat diawasi atau tidak diawasi.
Suatu neural net dikatakan belajar diawasi jika output yang diinginkan sudah diketahui. Contoh: asosiasi pola
Jaring saraf yang belajar tanpa pengawasan tidak memiliki output target seperti itu. Tidak dapat ditentukan seperti apa hasil dari proses pembelajaran akan terlihat. Selama proses pembelajaran, unit (nilai berat) dari jaringan saraf tersebut "diatur" di dalam kisaran tertentu, tergantung pada nilai input yang diberikan. Tujuannya adalah untuk mengelompokkan unit-unit serupa yang berdekatan di area tertentu dari rentang nilai. Contoh: klasifikasi pola
Pembelajaran terawasi, diberi data dengan jawaban.
Email yang diberi label sebagai spam / bukan spam, pelajari filter spam.
Dengan serangkaian data pasien yang didiagnosis menderita diabetes atau tidak, pelajari untuk mengklasifikasikan pasien baru sebagai penderita diabetes atau tidak.
Belajar tanpa pengawasan, diberi data tanpa jawaban, biarkan pc untuk mengelompokkan berbagai hal.
Diberikan satu set artikel berita yang ditemukan di web, kelompokkan ke dalam set artikel tentang cerita yang sama.
Dengan basis data data khusus, secara otomatis menemukan segmen pasar dan mengelompokkan pelanggan ke dalam segmen pasar yang berbeda.
Pembelajaran terawasi
Dalam hal ini, setiap pola input yang digunakan untuk melatih jaringan dikaitkan dengan pola output, yang merupakan target atau pola yang diinginkan. Seorang guru diasumsikan hadir selama proses pembelajaran, ketika perbandingan dibuat antara output jaringan yang dihitung dan output yang diharapkan benar, untuk menentukan kesalahan. Kesalahan kemudian dapat digunakan untuk mengubah parameter jaringan, yang menghasilkan peningkatan kinerja.
Pembelajaran tanpa pengawasan
Dalam metode pembelajaran ini, output target tidak disajikan ke jaringan. Seolah-olah tidak ada guru untuk menyajikan pola yang diinginkan dan karenanya, sistem belajar sendiri dengan menemukan dan beradaptasi dengan fitur struktural dalam pola input.
Supervised Learning : Anda memberikan berbagai contoh data berlabel sebagai input, bersama dengan jawaban yang benar. Algoritma ini akan belajar darinya, dan mulai memprediksi hasil yang benar berdasarkan input sesudahnya. Contoh : Email Spam filter
Pembelajaran tanpa pengawasan : Anda hanya memberikan data dan tidak memberi tahu apa pun - seperti label atau jawaban yang benar. Algoritma secara otomatis menganalisis pola dalam data. Contoh : Google News
Saya akan mencoba untuk membuatnya tetap sederhana.
Supervised Learning: Dalam teknik pembelajaran ini, kita diberikan satu set data dan sistem sudah mengetahui output yang benar dari set data. Jadi di sini, sistem kami belajar dengan memprediksi nilai sendiri. Kemudian, ia melakukan pemeriksaan akurasi dengan menggunakan fungsi biaya untuk memeriksa seberapa dekat prediksinya dengan output aktual.
Pembelajaran Tanpa Pengawasan: Dalam pendekatan ini, kami memiliki sedikit atau tidak sama sekali pengetahuan tentang apa hasil kami nantinya. Jadi sebagai gantinya, kami memperoleh struktur dari data di mana kami tidak tahu pengaruh variabel. Kami membuat struktur dengan mengelompokkan data berdasarkan hubungan antar variabel dalam data. Di sini, kami tidak memiliki umpan balik berdasarkan prediksi kami.
Anda memiliki input x dan target output t. Jadi, Anda melatih algoritme untuk menggeneralisasi ke bagian yang hilang. Itu diawasi karena target diberikan. Anda adalah pengawas yang memberi tahu algoritma: Sebagai contoh x, Anda harus menampilkan t!
Meskipun segmentasi, pengelompokan, dan kompresi biasanya dihitung dalam arah ini, saya kesulitan menemukan definisi yang bagus untuk itu.
Mari kita ambil auto-encoders untuk kompresi sebagai contoh. Meskipun Anda hanya memiliki input x yang diberikan, itu adalah insinyur manusia bagaimana memberitahu algoritma bahwa targetnya juga x. Jadi dalam beberapa hal, ini tidak berbeda dengan pembelajaran yang diawasi.
Dan untuk pengelompokan dan segmentasi, saya tidak terlalu yakin apakah itu benar-benar cocok dengan definisi pembelajaran mesin (lihat pertanyaan lain ).
Supervised Learning: Anda telah memberi label data dan harus belajar dari itu. mis. data rumah beserta harga dan kemudian belajar memprediksi harga
Pembelajaran tanpa pengawasan: Anda harus menemukan tren dan kemudian memperkirakan, tidak ada label sebelumnya yang diberikan. misalnya orang yang berbeda di kelas dan kemudian orang baru datang sehingga kelompok apa yang dimiliki oleh siswa baru ini.
Dalam Pembelajaran Terawasi kita tahu apa input dan output seharusnya. Misalnya diberi seperangkat mobil. Kita harus mencari tahu mana yang merah dan mana yang biru.
Padahal, belajar tanpa pengawasan adalah di mana kita harus mencari tahu jawabannya dengan sedikit atau tanpa ide tentang bagaimana seharusnya hasilnya. Sebagai contoh, pelajar mungkin dapat membangun model yang mendeteksi ketika orang tersenyum berdasarkan korelasi pola wajah dan kata-kata seperti "apa yang kamu tersenyum?".
Pembelajaran yang diawasi dapat memberi label item baru ke salah satu label yang dilatih berdasarkan pembelajaran selama pelatihan. Anda perlu memberikan sejumlah besar kumpulan data pelatihan, kumpulan data validasi, dan set data uji. Jika Anda memberikan vektor gambar piksel katakana bersama dengan data pelatihan dengan label, maka itu dapat mengidentifikasi angka-angka.
Pembelajaran tanpa pengawasan tidak membutuhkan set data pelatihan. Dalam pembelajaran tanpa pengawasan dapat mengelompokkan item ke dalam kelompok yang berbeda berdasarkan perbedaan dalam vektor input. Jika Anda memberikan vektor gambar piksel angka dan memintanya untuk dikelompokkan ke dalam 10 kategori, ia dapat melakukannya. Tetapi ia tahu cara memberi label karena Anda belum memberikan label pelatihan.
Pembelajaran terawasi pada dasarnya adalah di mana Anda memiliki variabel input (x) dan variabel output (y) dan menggunakan algoritma untuk mempelajari fungsi pemetaan dari input ke output. Alasan mengapa kami menyebut ini sebagai diawasi adalah karena algoritma belajar dari dataset pelatihan, algoritma iteratif membuat prediksi pada data pelatihan. Dibimbing memiliki dua jenis-Klasifikasi dan Regresi. Klasifikasi adalah ketika variabel output adalah kategori seperti ya / tidak, benar / salah. Regresi adalah ketika output adalah nilai nyata seperti ketinggian orang, Suhu dll.
Pembelajaran yang diawasi UN adalah di mana kita hanya memasukkan data (X) dan tidak ada variabel keluaran. Ini disebut pembelajaran tanpa pengawasan karena tidak seperti pembelajaran dengan pengawasan di atas tidak ada jawaban yang benar dan tidak ada guru. Algoritma diserahkan kepada alat mereka sendiri untuk menemukan dan menyajikan struktur yang menarik dalam data.
Jenis pembelajaran tanpa pengawasan adalah pengelompokan dan Asosiasi.
Supervised Learning pada dasarnya adalah teknik di mana data pelatihan dari mana mesin belajar sudah diberi label yang mengandaikan pengelompokan angka ganjil bahkan ganjil di mana Anda telah mengklasifikasikan data selama pelatihan. Karena itu ia menggunakan data "LABELED".
Sebaliknya, pembelajaran yang tidak diawasi adalah teknik di mana mesin itu sendiri memberi label data. Atau Anda bisa mengatakan itu masalahnya ketika mesin belajar sendiri dari awal.
Dalam Pembelajaran Sederhana Supervisi adalah jenis masalah pembelajaran mesin di mana kami memiliki beberapa label dan dengan menggunakan label itu kami menerapkan algoritma seperti regresi dan klasifikasi. Klasifikasi diterapkan di mana output kami seperti dalam bentuk 0 atau 1, benar / salah, ya Tidak. dan regresi diterapkan di mana menempatkan nilai nyata seperti rumah harga
Pembelajaran tanpa pengawasan adalah jenis masalah pembelajaran mesin di mana kami tidak memiliki label berarti kami memiliki beberapa data saja, data tidak terstruktur dan kami harus mengelompokkan data (pengelompokan data) menggunakan berbagai algoritma tanpa pengawasan
Pembelajaran Mesin yang diawasi
"Proses algoritma belajar dari dataset pelatihan dan memprediksi hasilnya."
Akurasi output yang diprediksi berbanding lurus dengan data pelatihan (panjang)
Pembelajaran terawasi adalah tempat Anda memiliki variabel input (x) (dataset pelatihan) dan variabel output (Y) (dataset pengujian) dan Anda menggunakan algoritma untuk mempelajari fungsi pemetaan dari input ke output.
Y = f(X)
Jenis utama:
Algoritma:
Algoritma Klasifikasi:
Neural Networks
Naïve Bayes classifiers
Fisher linear discriminant
KNN
Decision Tree
Super Vector Machines
Algoritma Prediktif:
Nearest neighbor
Linear Regression,Multi Regression
Area aplikasi:
Pengenalan suara
Memprediksi SDM memilih kandidat tertentu atau tidak
Memprediksi harga pasar saham
Pembelajaran terawasi :
Algoritma pembelajaran yang diawasi menganalisis data pelatihan dan menghasilkan fungsi yang disimpulkan, yang dapat digunakan untuk memetakan contoh-contoh baru.
Kategori masalah:
Regresi: Memprediksi hasil dalam output kontinu => memetakan variabel input ke beberapa fungsi kontinu.
Contoh:
Diberi gambar seseorang, prediksi usianya
Klasifikasi: Memprediksi hasil dalam output diskrit => memetakan variabel input ke dalam kategori diskrit
Contoh:
Apakah ini kanker?
Pembelajaran tanpa pengawasan:
Pembelajaran tanpa pengawasan belajar dari data uji yang belum diberi label, diklasifikasikan atau dikategorikan. Pembelajaran tanpa pengawasan mengidentifikasi kesamaan dalam data dan bereaksi berdasarkan ada tidaknya kesamaan di setiap bagian data yang baru.
Kita dapat memperoleh struktur ini dengan mengelompokkan data berdasarkan hubungan antar variabel dalam data.
Tidak ada umpan balik berdasarkan hasil prediksi.
Kategori masalah:
Kekelompokan: adalah tugas pengelompokan satu set objek sedemikian rupa sehingga objek dalam grup yang sama (disebut cluster) lebih mirip (dalam beberapa hal) satu sama lain daripada pada kelompok lain (cluster)
Contoh:
Ambil koleksi 1.000.000 gen yang berbeda, dan temukan cara untuk secara otomatis mengelompokkan gen-gen ini ke dalam kelompok-kelompok yang entah bagaimana serupa atau terkait oleh variabel yang berbeda, seperti umur, lokasi, peran, dan sebagainya .
Kasus penggunaan populer tercantum di sini.
Perbedaan antara klasifikasi dan clustering dalam penambangan data?
Referensi:
Pembelajaran yang tidak diawasi
Pembelajaran terawasi
Pembelajaran tanpa pengawasan
Contoh:
Pembelajaran terawasi:
Satu tas dengan oranye
=> membangun model
Satu tas campuran apel dan jeruk.
=> Silakan klasifikasikan
Pembelajaran tanpa pengawasan:
Satu tas campuran apel dan jeruk.
=> membangun model
Tas campuran lain
=> Silakan klasifikasikan
Dengan kata-kata sederhana .. :) Ini pemahaman saya, silakan koreksi. Pembelajaran terawasi adalah, kita tahu apa yang kita prediksi berdasarkan data yang diberikan. Jadi kami memiliki kolom di dataset yang perlu dipredikatkan. Pembelajaran tanpa pengawasan adalah, kami mencoba mengekstrak makna dari dataset yang disediakan. Kami tidak memiliki kejelasan tentang apa yang akan diprediksi. Jadi pertanyaannya adalah mengapa kita melakukan ini? .. :) Jawabannya adalah - hasil pembelajaran tanpa pengawasan adalah kelompok / kelompok (data yang sama bersama). Jadi jika kami menerima data baru maka kami mengaitkannya dengan cluster / grup yang diidentifikasi dan memahami fitur-fiturnya.
Saya harap ini akan membantu Anda.
pembelajaran yang diawasi
supervised learning adalah tempat kita mengetahui output dari input mentah, yaitu data diberi label sehingga selama pelatihan model pembelajaran mesin akan memahami apa yang perlu dideteksi dalam memberikan output, dan itu akan memandu sistem selama pelatihan untuk mendeteksi objek yang sudah diberi label berdasarkan hal itu akan mendeteksi objek serupa yang telah kami sediakan dalam pelatihan.
Di sini algoritma akan tahu apa struktur dan pola data. Pembelajaran terawasi digunakan untuk klasifikasi
Sebagai contoh, kita dapat memiliki objek yang berbeda yang bentuknya persegi, lingkaran, trianle. Tugas kita adalah mengatur jenis bentuk yang sama dengan label berlabel yang memiliki semua bentuk berlabel, dan kita akan melatih model pembelajaran mesin pada dataset itu, pada berdasarkan tanggal pelatihan itu akan mulai mendeteksi bentuk.
Belajar tanpa pengawasan
Pembelajaran yang tidak diawasi adalah pembelajaran yang tidak terarah dimana hasil akhirnya tidak diketahui, itu akan mengelompokkan dataset dan berdasarkan pada sifat yang sama dari objek itu akan membagi objek pada tandan yang berbeda dan mendeteksi objek.
Di sini algoritma akan mencari pola yang berbeda dalam data mentah, dan berdasarkan itu akan mengelompokkan data. Pembelajaran yang tidak diawasi digunakan untuk pengelompokan.
Sebagai contoh, kita dapat memiliki objek yang berbeda dari berbagai bentuk persegi, lingkaran, segitiga, sehingga akan membuat tandan berdasarkan pada properti objek, jika suatu objek memiliki empat sisi ia akan menganggapnya persegi, dan jika memiliki tiga sisi segitiga dan jika tidak ada sisi selain lingkaran, di sini data tidak diberi label, itu akan belajar sendiri untuk mendeteksi berbagai bentuk
Pembelajaran mesin adalah bidang di mana Anda mencoba membuat mesin untuk meniru perilaku manusia.
Anda melatih mesin seperti bayi. Cara manusia belajar, mengidentifikasi fitur, mengenali pola, dan melatih dirinya sendiri, sama seperti Anda melatih mesin dengan memasukkan data dengan berbagai fitur. Algoritma mesin mengidentifikasi pola dalam data dan mengklasifikasikannya ke dalam kategori tertentu.
Pembelajaran mesin secara luas dibagi menjadi dua kategori, pembelajaran dengan pengawasan dan tanpa pengawasan.
Pembelajaran terawasi adalah konsep di mana Anda memiliki input vektor / data dengan nilai target (output) yang sesuai. Di sisi lain pembelajaran tanpa pengawasan adalah konsep di mana Anda hanya memiliki vektor input / data tanpa nilai target yang sesuai.
Contoh pembelajaran terawasi adalah pengenalan digit tulisan tangan di mana Anda memiliki gambar digit dengan digit yang sesuai [0-9], dan contoh pembelajaran tanpa pengawasan adalah mengelompokkan pelanggan berdasarkan perilaku pembelian.