Pengawasan jauh: diawasi, semi-diawasi, atau keduanya?


20

"Pengawasan jauh" adalah skema pembelajaran di mana pengklasifikasi dipelajari dengan perangkat pelatihan yang berlabel lemah (data pelatihan diberi label secara otomatis berdasarkan heuristik / aturan). Saya pikir baik pembelajaran yang diawasi, dan pembelajaran semi-diawasi dapat mencakup "pengawasan yang jauh" jika data yang diberi label secara heuristik / secara otomatis diberi label. Namun, di halaman ini , "pengawasan jauh" didefinisikan sebagai "pembelajaran semi-diawasi" (yaitu, terbatas pada "semi-pengawasan").

Jadi pertanyaan saya adalah, apakah "pengawasan jauh" secara eksklusif merujuk pada semi-pengawasan? Menurut pendapat saya itu dapat diterapkan untuk pembelajaran yang diawasi dan semi-diawasi. Harap berikan referensi yang dapat diandalkan jika ada.

Jawaban:


22

Algoritma pengawasan jauh biasanya memiliki langkah-langkah berikut:
1] Ini mungkin memiliki beberapa data pelatihan berlabel
2] Ini "memiliki" akses ke kumpulan data yang tidak berlabel
3] Ia memiliki operator yang memungkinkannya untuk mengambil sampel dari data yang tidak berlabel ini dan melabelinya dan operator ini diharapkan akan berisik dalam labelnya
4] Algoritma kemudian secara kolektif menggunakan data pelatihan yang diberi label asli jika ada dan data baru berlabel berisik ini untuk memberikan hasil akhir.

Sekarang, untuk menjawab pertanyaan Anda, Anda dan situs keduanya benar. Anda melihat langkah ke-4 dari algoritma dan perhatikan bahwa pada langkah ke-4 orang dapat menggunakan algoritma apa pun yang dapat diakses oleh pengguna. Karena itu maksud Anda, "itu dapat diterapkan untuk pembelajaran yang diawasi dan semi-diawasi" .

Sedangkan situs sedang melihat semua langkah 1-4 secara kolektif dan memperhatikan bahwa data yang berlabel berisik diperoleh dari kumpulan data yang tidak berlabel (dengan atau tanpa menggunakan beberapa data pelatihan yang sudah ada sebelumnya) dan proses memperoleh label yang berisik ini. adalah komponen penting untuk algoritma pengawasan jarak jauh, karenanya merupakan algoritma semi-diawasi.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.