Jawaban sebelumnya sangat bagus, saya ingin menunjukkan beberapa tambahan lagi:
Segmentasi Objek
salah satu alasan mengapa hal ini tidak disukai oleh komunitas penelitian adalah karena hal ini tidak jelas secara problematis. Segmentasi objek biasanya berarti menemukan satu atau sedikit objek dalam sebuah gambar dan menggambar batas di sekitarnya, dan untuk sebagian besar tujuan Anda masih dapat berasumsi demikian. Namun, ini juga mulai digunakan untuk segmentasi blob yang mungkin menjadi objek, segmentasi objek dari latar belakang (lebih umum sekarang disebut pengurangan latar belakang atau segmentasi latar belakang atau deteksi latar depan), dan bahkan dalam beberapa kasus digunakan secara bergantian dengan pengenalan objek menggunakan kotak pembatas (ini dengan cepat berhenti dengan munculnya pendekatan jaringan saraf dalam untuk pengenalan objek, tetapi pengenalan objek sebelumnya juga bisa berarti hanya memberi label pada seluruh gambar dengan objek di dalamnya).
Apa yang membuat "segmentasi" "semantik"?
Simpy, setiap segmen, atau dalam kasus metode mendalam setiap piksel, diberi label kelas berdasarkan kategori. Segmentasi secara umum hanyalah pembagian gambar dengan beberapa aturan. Segmentasi pergeseran , misalnya, dari tingkat yang sangat tinggi membagi data sesuai dengan perubahan energi gambar. Potongan grafiksegmentasi berbasis sama tidak dipelajari tetapi langsung diturunkan dari properti setiap gambar yang terpisah dari yang lain. Metode (berbasis jaringan neural) yang lebih baru menggunakan piksel yang diberi label untuk belajar mengidentifikasi fitur lokal yang terkait dengan kelas tertentu, lalu mengklasifikasikan setiap piksel berdasarkan kelas mana yang memiliki tingkat keyakinan tertinggi untuk piksel tersebut. Dengan cara ini, "pelabelan piksel" sebenarnya adalah nama yang lebih jujur untuk tugas tersebut, dan komponen "segmentasi" muncul.
Segmentasi Instance
Bisa dibilang arti yang paling sulit, relevan, dan asli dari Segmentasi Objek, "segmentasi contoh" berarti segmentasi objek individu dalam sebuah adegan, terlepas dari apakah mereka memiliki tipe yang sama. Namun, salah satu alasan mengapa hal ini begitu sulit adalah karena dari perspektif visi (dan dalam beberapa hal filosofis) apa yang membuat contoh "objek" tidak sepenuhnya jelas. Apakah bagian tubuh objek? Haruskah "objek bagian" seperti itu disegmentasi sama sekali oleh algoritme segmentasi instance? Haruskah mereka hanya tersegmentasi jika terlihat terpisah dari keseluruhan? Bagaimana dengan benda majemuk jika dua benda berdampingan dengan jelas tetapi dapat dipisahkan menjadi satu atau dua benda (apakah batu yang direkatkan ke puncak tongkat adalah kapak, palu, atau hanya tongkat dan batu kecuali dibuat dengan benar?). Juga, bukan t jelas bagaimana membedakan contoh. Apakah sebuah wasiat merupakan contoh terpisah dari dinding lain tempat itu dipasang? Dalam urutan apa contoh harus dihitung? Saat mereka muncul? Kedekatan dengan sudut pandang? Terlepas dari kesulitan ini, segmentasi objek masih menjadi masalah besar karena sebagai manusia kita berinteraksi dengan objek sepanjang waktu terlepas dari "label kelas" -nya (menggunakan objek acak di sekitar Anda sebagai pemberat kertas, duduk di atas benda yang bukan kursi), dan beberapa kumpulan data mencoba untuk mengatasi masalah ini, tetapi alasan utama belum banyak perhatian yang diberikan untuk masalah ini adalah karena belum didefinisikan dengan cukup baik.
Scene Parsing / Scene labeling
Scene Parsing adalah pendekatan segmentasi ketat untuk pelabelan adegan, yang juga memiliki beberapa masalah ketidakjelasan tersendiri. Secara historis, pelabelan adegan dimaksudkan untuk membagi seluruh "adegan" (gambar) menjadi beberapa segmen dan memberi mereka semua label kelas. Namun, itu juga digunakan untuk memberikan label kelas ke area gambar tanpa secara eksplisit menyegmentasikannya. Sehubungan dengan segmentasi, "segmentasi semantik" tidak berarti membagi seluruh pemandangan. Untuk segmentasi semantik, algoritme dimaksudkan untuk menyegmentasikan hanya objek yang diketahuinya, dan akan dikenakan sanksi oleh fungsi kerugiannya untuk memberi label piksel yang tidak memiliki label apa pun. Misalnya dataset MS-COCO adalah dataset untuk segmentasi semantik dimana hanya beberapa objek yang tersegmentasi.