Apa sebenarnya perbedaan antara pembelajaran terawasi dan tidak terawasi?


28

Saya mencoba memahami metode pengelompokan.

Apa yang saya pikir saya mengerti:

  1. Dalam pembelajaran terawasi, data kategori / label yang ditetapkan diketahui sebelum perhitungan. Jadi, label, kelas atau kategori sedang digunakan untuk "mempelajari" parameter yang benar-benar signifikan untuk cluster tersebut.

  2. Dalam pembelajaran tanpa pengawasan, kumpulan data ditugaskan ke segmen, tanpa diketahui kelompoknya.

Apakah itu berarti bahwa, jika saya bahkan tidak tahu parameter mana yang penting untuk segmentasi, saya harus lebih memilih pembelajaran yang diawasi?


2
Perhatikan bahwa pengelompokan bukan satu-satunya jenis pembelajaran tanpa pengawasan.
George

1
Pembelajaran terawasi lebih disukai ketika data pelatihan berlabel tersedia. Anda dapat mempartisi data Anda menggunakan metode yang diawasi atau tidak diawasi. Perbedaan utama adalah bahwa dalam pengaturan yang dilindungi, Anda tahu segmentasi CORRECT untuk data pelatihan Anda.
Nick

Jawaban:


23

Perbedaannya adalah bahwa dalam pembelajaran yang diawasi "kategori", "kelas" atau "label" diketahui. Dalam pembelajaran yang tidak diawasi, mereka tidak, dan proses pembelajaran berusaha untuk menemukan "kategori" yang tepat. Dalam kedua jenis pembelajaran semua parameter dianggap untuk menentukan mana yang paling tepat untuk melakukan klasifikasi.

Apakah Anda memilih diawasi atau tidak diawasi harus didasarkan pada apakah Anda tahu apa "kategori" data Anda. Jika Anda tahu, gunakan pembelajaran terawasi. Jika Anda tidak tahu, maka gunakan tanpa pengawasan.

Karena Anda memiliki sejumlah besar parameter dan Anda tidak tahu mana yang relevan, Anda bisa menggunakan sesuatu seperti analisis komponen utama untuk membantu menentukan yang relevan.


13

Perhatikan bahwa ada lebih dari 2 derajat pengawasan. Sebagai contoh, lihat halaman 24-25 (6-7) dalam tesis PhD Christian Biemann, Tanpa Pengawasan dan Pemrosesan Bahasa Alami tanpa Pengetahuan dalam Paradigma Penemuan Struktur, 2007.

Tesis ini mengidentifikasi 4 derajat: diawasi, semi-diawasi, diawasi dengan lemah, dan tidak diawasi, dan menjelaskan perbedaannya, dalam konteks pemrosesan bahasa alami. Berikut adalah definisi yang relevan:

  • Dalam sistem yang diawasi , data yang disajikan ke algoritma pembelajaran mesin diberi label penuh. Itu berarti: semua contoh disajikan dengan klasifikasi bahwa mesin dimaksudkan untuk mereproduksi. Untuk ini, sebuah classifier dipelajari dari data, proses pemberian label ke instance yang belum terlihat disebut klasifikasi.
  • Dalam sistem semi-diawasi , mesin juga diizinkan untuk mengambil data yang tidak berlabel. Karena basis data yang lebih besar, sistem semi-diawasi sering mengungguli rekan-rekan mereka yang diawasi menggunakan contoh berlabel yang sama. Alasan untuk perbaikan ini adalah bahwa lebih banyak data tidak berlabel memungkinkan sistem untuk memodelkan struktur data yang melekat dengan lebih akurat.
  • Bootstrapping, juga disebut pelatihan mandiri, adalah suatu bentuk pembelajaran yang dirancang untuk menggunakan contoh pelatihan yang lebih sedikit, oleh karena itu kadang-kadang disebut dengan pengawasan yang lemah . Bootstrapping dimulai dengan beberapa contoh pelatihan, melatih classifier, dan menggunakan contoh-contoh positif yang dianggap dihasilkan oleh classifier ini untuk pelatihan ulang. Seiring bertambahnya jumlah contoh pelatihan, penggolong meningkatkan, asalkan tidak terlalu banyak contoh negatif yang salah diklasifikasikan sebagai positif, yang dapat menyebabkan penurunan kinerja.
  • Sistem yang tidak diawasi tidak disediakan contoh pelatihan sama sekali dan melakukan pengelompokan. Ini adalah pembagian instance data menjadi beberapa kelompok. Hasil algoritma pengelompokan adalah data driven, karenanya lebih 'alami' dan lebih cocok untuk struktur data yang mendasarinya. Keuntungan ini juga merupakan kelemahan utamanya: tanpa kemungkinan untuk memberi tahu mesin apa yang harus dilakukan (seperti dalam klasifikasi), sulit untuk menilai kualitas hasil pengelompokan dengan cara yang konklusif. Tetapi ketiadaan persiapan contoh pelatihan membuat paradigma yang tidak diawasi sangat menarik.

0

Dalam pembelajaran yang diawasi, kelas-kelas diketahui sebelumnya dan juga tipenya, misalnya, dua kelas pelanggan baik dan buruk. Ketika objek baru (pelanggan) datang berdasarkan atributnya, pelanggan dapat ditugaskan ke kelas pelanggan yang buruk atau baik.

Dalam pembelajaran tanpa pengawasan, kelompok / kelas belum diketahui, kami memiliki objek (pelanggan), jadi kelompok pelanggan yang memiliki kebiasaan membeli yang sama maka kelompok yang berbeda dibuat dari pelanggan yaitu belum diketahui berdasarkan kebiasaan membeli yang serupa.


0

Dalam pembelajaran yang diawasi, output (variabel dependen) tergantung pada variabel input (variabel independen). Dalam beberapa set pengawasan yang diberikan, responden mencoba menghitung tujuan yang diinginkan.

Dalam pembelajaran tanpa pengawasan tidak ada pengawasan sehingga sistem mencoba menyesuaikan diri dengan situasi dan belajar secara manual berdasarkan beberapa ukuran.

misal: Guru di kelas - supervisi - pembelajaran terawasi Belajar mandiri elektif di kelas - Tidak ada pengawasan Belajar tanpa pengawasan

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.