Dalam konteks pembelajaran mesin, apa perbedaannya
- belajar tanpa pengawasan
- pembelajaran yang diawasi dan
- pembelajaran semi-terawasi?
Dan apa saja beberapa pendekatan algoritmik utama untuk dilihat?
Dalam konteks pembelajaran mesin, apa perbedaannya
Dan apa saja beberapa pendekatan algoritmik utama untuk dilihat?
Jawaban:
Secara umum, masalah pembelajaran mesin dapat dianggap variasi pada estimasi fungsi untuk klasifikasi, prediksi atau pemodelan.
Dalam pembelajaran yang diawasi seseorang dilengkapi dengan input ( , , ...,) dan output ( , , ...,) dan ditantang untuk menemukan fungsi yang mendekati perilaku ini dengan cara yang dapat digeneralisasikan. Outputnya bisa berupa label kelas (dalam klasifikasi) atau bilangan real (dalam regresi) - ini adalah "supervisi" dalam pembelajaran yang diawasi.
Dalam hal pembelajaran tanpa pengawasan , dalam kasus dasar, Anda menerima input , , ..., tetapi output target, atau hadiah dari lingkungannya tidak disediakan. Berdasarkan masalah (mengklasifikasikan, atau memprediksi) dan latar belakang pengetahuan Anda tentang ruang sampel, Anda dapat menggunakan berbagai metode: estimasi kepadatan (memperkirakan beberapa PDF yang mendasari untuk prediksi), k-means clustering (mengklasifikasikan data bernilai nyata yang tidak diberi label), k- mode clustering (mengklasifikasikan data kategori tidak berlabel), dll.
Pembelajaran semi-diawasi melibatkan estimasi fungsi pada data berlabel dan tidak berlabel. Pendekatan ini dimotivasi oleh fakta bahwa data berlabel sering kali mahal untuk dihasilkan, sedangkan data yang tidak berlabel umumnya tidak. Tantangan di sini sebagian besar melibatkan pertanyaan teknis tentang bagaimana memperlakukan data yang dicampur dengan cara ini. Lihat Survei Sastra Belajar Semi-Supervisi ini untuk detail lebih lanjut tentang metode belajar semi-diawasi
Selain jenis pembelajaran ini, ada yang lain, seperti pembelajaran penguatan di mana metode pembelajaran berinteraksi dengan lingkungannya dengan menghasilkan tindakan , ,. . .. yang menghasilkan hadiah atau hukuman , , ...
Pembelajaran tanpa pengawasan
Pembelajaran tanpa pengawasan adalah saat Anda tidak memiliki data berlabel yang tersedia untuk pelatihan. Contohnya adalah metode pengelompokan.
Pembelajaran terawasi
Dalam hal ini data pelatihan Anda ada di luar data berlabel. Masalah yang Anda selesaikan di sini adalah sering memprediksi label untuk titik data tanpa label.
Pembelajaran Semi-Supervisi
Dalam hal ini digunakan data berlabel dan data tidak berlabel. Ini misalnya dapat digunakan dalam jaringan Keyakinan mendalam, di mana beberapa lapisan mempelajari struktur data (tanpa pengawasan) dan satu lapisan digunakan untuk membuat klasifikasi (dilatih dengan data yang diawasi)
Saya tidak berpikir bahwa diawasi / tidak diawasi adalah cara terbaik untuk memikirkannya. Untuk penggalian data dasar, lebih baik pikirkan apa yang Anda coba lakukan. Ada empat tugas utama:
ramalan. jika Anda memprediksi bilangan real, itu disebut regresi. jika Anda memprediksi bilangan bulat atau kelas, itu disebut klasifikasi.
pemodelan. pemodelan sama dengan prediksi, tetapi model itu dapat dipahami oleh manusia. Jaringan saraf dan mesin vektor bekerja dengan baik, tetapi tidak menghasilkan model yang dapat dipahami [1]. pohon keputusan dan regresi linier klasik adalah contoh model yang mudah dipahami.
kesamaan. jika Anda mencoba menemukan kelompok atribut alami, itu disebut analisis faktor. jika Anda mencoba menemukan kelompok pengamatan alami, itu disebut pengelompokan.
asosiasi. ini seperti korelasi, tetapi untuk kumpulan data biner yang sangat besar.
[1] Tampaknya Goldman Sachs menciptakan banyak sekali jaringan saraf untuk prediksi, tetapi kemudian tidak ada yang memahaminya, jadi mereka harus menulis program lain untuk mencoba menjelaskan jaringan saraf itu.