Sejauh klasifikasi berbasis pixel yang bersangkutan, Anda tepat. Setiap piksel adalah vektor n-dimensi dan akan ditetapkan ke beberapa kelas berdasarkan beberapa metrik, baik menggunakan Support Vector Machines, MLE, semacam knn classifier, dll.
Sejauh menyangkut pengklasifikasi berbasis wilayah, ada perkembangan besar dalam beberapa tahun terakhir, didorong oleh kombinasi GPU, data dalam jumlah besar, cloud dan ketersediaan algoritma yang luas berkat pertumbuhan sumber terbuka (difasilitasi oleh github). Salah satu perkembangan terbesar dalam visi / klasifikasi komputer adalah pada jaringan saraf convolutional (CNNs). Lapisan konvolusional "mempelajari" fitur yang mungkin didasarkan pada warna, seperti dengan pengklasifikasi berbasis piksel tradisional, tetapi juga membuat detektor tepi dan semua jenis ekstraktor fitur lain yang dapat ada di wilayah piksel (maka bagian konvolusional) yang Anda tidak dapat mengekstraksi dari klasifikasi berbasis piksel. Ini berarti mereka lebih kecil kemungkinannya untuk mengklasifikasikan salah satu piksel di tengah-tengah area piksel jenis lainnya - jika Anda pernah menjalankan klasifikasi dan mendapatkan es di tengah Amazon, Anda akan memahami masalah ini.
Anda kemudian menerapkan jaringan saraf yang terhubung penuh ke "fitur" yang dipelajari melalui konvolusi untuk benar-benar melakukan klasifikasi. Salah satu keuntungan besar CNN lainnya adalah bahwa mereka berskala dan invarian rotasi, karena biasanya ada lapisan menengah antara lapisan konvolusi dan lapisan klasifikasi yang menggeneralisasi fitur, menggunakan pooling dan dropout, untuk menghindari overfitting, dan membantu dengan masalah di sekitar skala dan orientasi.
Ada banyak sumber daya pada jaringan saraf convolutional, meskipun yang terbaik harus kelas Standord dari Andrei Karpathy , yang merupakan salah satu pelopor bidang ini, dan seluruh seri kuliah tersedia di youtube .
Tentu, ada cara lain untuk berurusan dengan klasifikasi berbasis pixel versus area, tetapi ini saat ini merupakan pendekatan mutakhir, dan memiliki banyak aplikasi di luar klasifikasi penginderaan jauh, seperti terjemahan mesin dan mobil self-driving.
Berikut adalah contoh lain dari klasifikasi berbasis wilayah , menggunakan Open Street Map untuk menandai data pelatihan, termasuk instruksi untuk mengatur TensorFlow dan berjalan di AWS.
Berikut ini adalah contoh menggunakan Google Earth Engine dari penggolong berdasarkan deteksi tepi, dalam hal ini untuk irigasi pivot - menggunakan tidak lebih dari kernel dan konvolusi Gaussian, tetapi sekali lagi, menunjukkan kekuatan pendekatan berbasis wilayah / tepi.
Sementara keunggulan objek lebih dari klasifikasi berbasis pixel cukup diterima secara luas, berikut adalah artikel yang menarik di Remote Sensing Letters yang menilai kinerja klasifikasi berbasis objek .
Akhirnya, contoh yang lucu, hanya untuk menunjukkan bahwa bahkan dengan pengklasifikasi berbasis regional / konvolusional, visi komputer masih sangat sulit - untungnya, orang-orang terpintar di Google, Facebook, dll, sedang bekerja pada algoritma untuk dapat menentukan perbedaan antara anjing, kucing, dan berbagai jenis anjing dan kucing. Jadi, mereka yang tertarik menggunakan penginderaan jauh bisa tidur nyenyak di malam hari: D