Apa pembelajaran mandiri dalam pembelajaran mesin?


Jawaban:


29

Pembelajaran dengan pengawasan sendiri (atau pengawasan diri) adalah teknik pembelajaran yang relatif baru (dalam pembelajaran mesin) di mana data pelatihan diberi label secara otonom (atau secara otomatis). Ini masih merupakan pembelajaran yang diawasi, tetapi dataset tidak perlu secara manual dilabel oleh manusia, tetapi mereka dapat misalnya diberi label dengan menemukan dan mengeksploitasi hubungan (atau korelasi) antara sinyal input yang berbeda (yaitu, input yang berasal dari modalitas sensor yang berbeda ).

Keuntungan alami dan konsekuensi dari pembelajaran yang diawasi sendiri adalah bahwa hal itu dapat lebih mudah (sehubungan dengan misalnya pembelajaran yang diawasi) dilakukan secara online (mengingat bahwa data dapat dikumpulkan dan diberi label tanpa campur tangan manusia), di mana model dapat diperbarui atau dilatih sepenuhnya dari awal. Oleh karena itu, pembelajaran yang diawasi sendiri juga harus cocok untuk perubahan lingkungan, data dan, secara umum, situasi.

Sebagai contoh, perhatikan robot yang dilengkapi dengan sensor proximity (yang merupakan sensor jarak pendek yang mampu mendeteksi objek di depan robot pada jarak pendek) dan kamera (yang merupakan sensor jarak jauh , tetapi yang tidak memberikan cara langsung mendeteksi objek). Anda juga dapat mengasumsikan bahwa robot ini mampu melakukan odometri . Contoh dari robot semacam itu adalah Mighty Thymio .

Pertimbangkan sekarang tugas mendeteksi objek di depan robot pada rentang yang lebih panjang daripada rentang yang dimungkinkan oleh sensor jarak. Secara umum, kami bisa melatih CNN untuk mencapai itu. Namun, untuk melatih CNN seperti itu, dalam pembelajaran yang diawasi, pertama-tama kita membutuhkan dataset berlabel, yang berisi gambar berlabel (atau video), di mana label tersebut dapat berupa "objek dalam gambar" atau "tidak ada objek dalam gambar". Dalam pembelajaran yang diawasi, set data ini perlu dilabel secara manual oleh manusia, yang jelas membutuhkan banyak pekerjaan.

Untuk mengatasi masalah ini, kita dapat menggunakan pendekatan belajar mandiri. Dalam contoh ini, ide dasarnya adalah mengaitkan output dari sensor jarak pada langkah waktut>t dengan output kamera pada langkah waktu t (langkah waktu yang lebih kecil dari t).

Lebih khusus lagi, anggaplah robot pada awalnya di koordinat(x,y) (di pesawat), pada langkah waktu t. Pada titik ini, kami masih belum memiliki info yang cukup untuk memberi label keluaran kamera (pada langkah waktu yang samat). Misalkan sekarang, pada waktu itut, robot sudah pada posisi (x,y). Tepat waktut, output dari sensor proximity misalnya akan menjadi "objek di depan robot" atau "tidak ada objek di depan robot". Tanpa kehilangan keumuman, anggaplah bahwa output dari sensor proximity dit>t adalah "tidak ada objek di depan robot", maka label terkait dengan output kamera (bingkai gambar) pada saat itu t akan "tidak ada objek di depan robot".

Untuk detail lebih lanjut tentang contoh khusus ini, lihat makalah Mempelajari Persepsi Jangka Panjang menggunakan Pengawasan Mandiri dari Sensor Jarak Pendek dan Odometri oleh Mirko Nava, Jérôme Guzzi, R. Omar Chavez-Garcia, Luca M. Gambardella dan Alessandro Giusti.

Perhatikan bahwa pembelajaran yang diawasi sendiri didefinisikan sedikit berbeda tergantung pada konteks atau area, yang dapat, misalnya, menjadi robot, pembelajaran penguatan atau pembelajaran representasi (atau fitur). Lebih tepatnya, definisi yang diberikan di atas digunakan dalam robotika. Lihat, misalnya, juga makalah ini Multi-task Self-Supervised Visual Learning . Untuk definisi yang sedikit berbeda dari belajar dengan pengawasan sendiri, lihat, misalnya, makalah Menggali Ke Dalam Estimasi Kedalaman Monokuler yang Dibimbing Sendiri .

Untuk pengantar pembelajaran mandiri lainnya, lihat artikel web ini: https://hackernoon.com/self-supervised-learning-gets-us-closer-to-autonomous-learning-be77e6c86b5a . Dalam artikel ini, penulis juga membandingkan pembelajaran mandiri dengan pembelajaran tanpa pengawasan, pembelajaran semi-diawasi dan pembelajaran penguatan.

Lebih jauh, jika Anda ingin mengetahui metode saat ini digunakan untuk pembelajaran mandiri, lihat artikel ini: https://amitness.com/2020/02/illustrated-self-supervised-learning . Dalam artikel ini, penulis merangkum ide-ide kunci dari metode yang diawasi mandiri yang ada dengan diagram dan visualisasi.

Ada juga daftar kurasi tautan ke makalah tempat pendekatan pembelajaran ini digunakan di URL berikut: https://github.com/jason718/awesome-self-supervised-learning .


Saya tidak setuju bahwa belajar dengan pengawasan sendiri berarti bahwa data diberi label, sehingga lapisan output idealnya sama dengan lapisan. Ambil contoh ini dan ini , mereka berdua mengatakan bahwa mereka menggunakan pembelajaran yang diawasi sendiri, tetapi tidak menggunakan label apa pun. Sebaliknya, kerugian dihitung dengan membengkokkan bingkai dalam video sesuai dengan output jaringan dan membandingkan bingkai bengkok dengan bingkai lain.
HelloGoodbye

@ HaloGoodbye Memang ada definisi belajar mandiri yang berbeda. Saya harus memperbarui jawaban ini. Definisi yang saya gunakan adalah yang paling umum dan digunakan dalam robotika. Semua yang lain tidak terlalu terkait dengan pembelajaran yang diawasi, sehingga penggunaannya sedikit tidak tepat atau menyesatkan. Penggunaan pembelajaran yang diawasi sendiri ini, dalam robotika, adalah yang paling tepat, mengingat hubungannya dengan pembelajaran yang diawasi.
nbro

2
Terima kasih telah menghubungkan posting saya di siang hari hacker
Dickey Singh

6

Pembelajaran mandiri adalah ketika Anda menggunakan beberapa bagian sampel sebagai label untuk tugas yang membutuhkan tingkat pemahaman yang baik untuk dipecahkan. Saya akan menekankan dua poin utama ini, sebelum memberikan contoh:

  • Label diekstraksi dari sampel , sehingga dapat dihasilkan secara otomatis, dengan beberapa algoritma yang sangat sederhana (mungkin hanya pemilihan acak).

  • Tugas itu membutuhkan pemahaman . Ini berarti bahwa, untuk memprediksi output, model harus mengekstraksi beberapa pola yang baik dari data, menghasilkan representasi yang baik pada proses.

Kasus yang sangat umum untuk pembelajaran semi-diawasi terjadi dalam pemrosesan bahasa alami, ketika Anda perlu menyelesaikan tugas tetapi memiliki sedikit data berlabel. Dalam kasus seperti itu, Anda perlu mempelajari model representasi atau bahasa yang baik, sehingga Anda mengambil kalimat dan memberikan tugas pengawasan diri jaringan Anda seperti ini:

  • Mintalah jaringan untuk memprediksi kata berikutnya dalam sebuah kalimat (yang Anda tahu karena Anda mengambilnya).

  • Topeng kata dan minta jaringan untuk memprediksi kata mana yang ada di sana (yang Anda tahu karena Anda harus menyembunyikannya).

  • Ubah kata untuk kata acak (yang mungkin tidak masuk akal) dan tanyakan pada jaringan kata mana yang salah.

Seperti yang Anda lihat, tugas-tugas ini cukup sederhana untuk dirumuskan dan labelnya adalah bagian dari sampel yang sama, tetapi mereka membutuhkan pemahaman tertentu tentang konteks yang harus dipecahkan.

Dan selalu seperti ini: ubah data Anda dengan cara tertentu, buat label dalam proses, dan tanyakan model apa yang terkait dengan transformasi itu. Jika tugas tersebut membutuhkan pemahaman yang cukup tentang data, Anda akan berhasil.


2

Pengenalan visual yang diawasi sendiri sering diterapkan untuk pembelajaran representasi. Di sini kita pertama belajar fitur pada data yang tidak berlabel (representasi pembelajaran), dan kemudian mempelajari model nyata pada fitur yang diekstraksi dari data yang diberi label. Ini khususnya masuk akal ketika kita memiliki banyak data yang tidak berlabel dan sedikit data yang berlabel.

Fitur-fiturnya dapat dipelajari dengan memecahkan apa yang disebut tugas dalih . Contoh tugas dalih adalah untuk memprediksi rotasi gambar yang gugup, untuk mengenali contoh gugup dari gambar yang sama, atau untuk memprediksi hubungan spasial patch gambar.

Tinjauan umum yang bagus dan hasil yang menarik dapat ditemukan dalam makalah baru-baru ini .

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.