Saya dapat melihat sejumlah masalah yang mungkin terjadi dengan pendekatan ini. Saya berbicara dari pengalaman saya sendiri di sini dari memperbaiki sistem penghitungan pejalan kaki dengan pendekatan yang sangat mirip, jadi saya tidak bermaksud mengecilkan hati. Sebaliknya, saya ingin memperingatkan Anda tentang kemungkinan rintangan yang mungkin harus Anda atasi untuk membangun sistem yang akurat dan kuat.
Pertama, substraksi latar belakang mengasumsikan bahwa objek yang menarik akan selalu bergerak, dan objek yang tidak Anda minati akan tetap diam. Tentunya, ini mungkin terjadi dalam skenario Anda, tetapi itu masih merupakan asumsi yang sangat terbatas. Saya juga menemukan substraksi latar belakang sangat sensitif terhadap perubahan pencahayaan (saya setuju dengan geometrikal).
Berhati-hatilah dalam membuat asumsi bahwa satu gumpalan = satu orang , bahkan jika Anda berpikir bahwa lingkungan Anda terkontrol dengan baik. Itu terjadi terlalu sering sehingga gumpalan yang sesuai dengan orang tidak terdeteksi karena mereka tidak bergerak atau terlalu kecil, sehingga mereka dihapus oleh erosi atau oleh beberapa kriteria ambang batas (dan percayalah, Anda tidak ingin masuk ke dalam " menyetel ambang sampai semuanya bekerja "menjebak. Tidak berhasil;)). Bisa juga terjadi bahwa gumpalan tunggal berkorespondensi dengan dua orang yang berjalan bersama, atau satu orang membawa barang bawaan. Atau seekor anjing. Jadi jangan membuat asumsi pintar tentang gumpalan.
Untungnya, karena Anda menyebutkan bahwa Anda menggunakan LBP untuk deteksi orang , saya pikir Anda berada di jalur yang benar untuk tidak membuat kesalahan dalam paragraf di atas. Saya tidak bisa berkomentar tentang efektivitas LBP pada khususnya. Saya juga membaca bahwa HOG (histogram gradien) adalah metode canggih dalam deteksi orang, lihat Histogram Gradien Berorientasi untuk Deteksi Manusia .
Keluhan terakhir saya terkait dengan penggunaan Camshift . Ini didasarkan pada histogram warna, jadi, dengan sendirinya, ia bekerja dengan baik ketika melacak satu objek yang mudah dibedakan berdasarkan warna, selama jendela pelacakan cukup besar dan tidak ada oklusi atau perubahan mendadak. Tetapi segera setelah Anda harus melacak beberapa target yang mungkin memiliki deskripsi warna yang sangat mirip dan yang akan bergerak sangat dekat satu sama lain, Anda tidak dapat melakukannya tanpa algoritma yang entah bagaimana memungkinkan Anda mempertahankan beberapa hipotesis. Ini bisa berupa filter partikel atau kerangka kerja seperti MCMCDA (Asosiasi Data Monte Carlo Markov Chain , lihat Asosiasi Data Markov Chain Monte Carlo untuk Pelacakan Multi-Target). Pengalaman saya menggunakan Meanshift sendirian ketika melacak beberapa objek adalah segala sesuatu yang tidak boleh terjadi dengan pelacakan: kehilangan jejak, target membingungkan, memperbaiki di latar belakang, dll. Baca sedikit tentang beberapa objek pelacakan dan masalah asosiasi data, ini mungkin di Bagaimanapun, hati menghitung banyak orang (saya katakan "mungkin" karena tujuan Anda menghitung tidak melacak, jadi saya tidak sepenuhnya membuang kemungkinan beberapa pendekatan pintar yang diperhitungkan tanpa pelacakan ...)
Nasihat terakhir saya adalah: hanya ada begitu banyak yang dapat Anda lakukan dengan pendekatan yang diberikan , dan Anda akan melakukan membutuhkan hal-hal yang lebih bagus untuk mencapai kinerja yang lebih baik (jadi saya tidak setuju dengan user36624 dalam hal ini). Ini bisa berarti mengubah sepotong algoritme Anda dengan sesuatu yang lebih kuat, atau mengubah arsitektur secara keseluruhan. Tentu saja, Anda harus tahu barang mewah mana yang benar-benar berguna bagi Anda. Ada publikasi yang berupaya memecahkan masalah dengan cara berprinsip, sementara yang lain hanya menghasilkan algoritme untuk kumpulan data yang diberikan dan mengharapkan Anda untuk melatih classifier yang tidak benar-benar cocok dengan masalah yang dihadapi, sambil meminta Anda untuk sesuaikan juga beberapa ambang batas. Penghitungan orang adalah penelitian, jadi jangan berharap hal-hal akan datang dengan mudah. Berusahalah untuk mempelajari hal-hal yang sedikit di luar kemampuan Anda, dan kemudian lakukan lagi dan lagi ...
Saya mengakui bahwa saya belum menawarkan solusi apa pun dan sebaliknya hanya menunjukkan kekurangan dalam pendekatan Anda (yang semuanya berasal dari pengalaman saya sendiri). Untuk inspirasi, saya sarankan Anda membaca beberapa penelitian terbaru, misalnya Stable Multi-Target Tracking dalam Video Surveillance Real-Time . Semoga berhasil!