"Apa cara paling benar informasi / fisika-teoritis untuk menghitung entropi suatu gambar?"
Pertanyaan yang sangat bagus dan tepat waktu.
Berlawanan dengan kepercayaan umum, memang mungkin untuk mendefinisikan entropi informasi alami (dan secara teoritis) secara intuitif untuk suatu gambar.
Pertimbangkan gambar berikut:
Kita dapat melihat bahwa gambar diferensial memiliki histogram yang lebih kompak, oleh karenanya entropi informasi Shannon lebih rendah. Jadi kita bisa mendapatkan redundansi yang lebih rendah dengan menggunakan entropi Shannon orde kedua (yaitu entropi yang berasal dari data diferensial). Jika kita dapat memperluas ide ini secara isotropis ke 2D, maka kita mungkin mengharapkan estimasi yang baik untuk entropi informasi gambar.
Histogram gradien dua dimensi memungkinkan ekstensi 2D.
Kami dapat memformalkan argumen dan, memang, ini telah selesai baru-baru ini. Rekap singkat:
Pengamatan bahwa definisi sederhana (lihat misalnya definisi entropi gambar MATLAB) mengabaikan struktur ruang sangat penting. Untuk memahami apa yang sedang terjadi, sebaiknya kembali ke kasus 1D secara singkat. Telah lama diketahui bahwa menggunakan histogram sinyal untuk menghitung informasi / entropinya Shannon mengabaikan struktur temporal atau spasial dan memberikan perkiraan yang buruk tentang kompresibilitas atau redundansi sinyal yang melekat. Solusinya sudah tersedia dalam teks klasik Shannon; menggunakan sifat urutan kedua dari sinyal, yaitu probabilitas transisi. Pengamatan pada tahun 1971 (Rice & Plaunt) bahwa prediktor terbaik dari nilai piksel dalam pemindaian raster adalah nilai piksel sebelumnya segera mengarah ke prediktor diferensial dan entropi urutan kedua Shannon yang sejajar dengan ide kompresi sederhana seperti pengkodean panjang berjalan. Ide-ide ini disempurnakan pada akhir 80-an menghasilkan beberapa teknik pengkodean lossless image (diferensial) klasik yang masih digunakan (PNG, JPG lossless, GIF, JPG2000 lossless) sementara wavelet dan DCT hanya digunakan untuk pengkodean lossy.
Pindah sekarang ke 2D; Peneliti menemukan sangat sulit untuk memperluas ide-ide Shannon ke dimensi yang lebih tinggi tanpa memperkenalkan ketergantungan orientasi. Secara intuitif, kita dapat mengharapkan entropi informasi Shannon menjadi independen dari orientasinya. Kami juga mengharapkan gambar dengan struktur spasial yang rumit (seperti contoh derau acak penanya) memiliki entropi informasi yang lebih tinggi daripada gambar dengan struktur spasial sederhana (seperti contoh skala abu-abu yang halus dari penanya). Ternyata alasan mengapa sangat sulit untuk memperluas ide-ide Shannon dari 1D ke 2D adalah bahwa ada asimetri (satu sisi) dalam formulasi asli Shannon yang mencegah formulasi simetris (isotropik) dalam 2D. Setelah asimetri 1D dikoreksi, ekstensi 2D dapat dilanjutkan dengan mudah dan alami.
Memotong ke pengejaran (pembaca yang berminat dapat memeriksa eksposisi terperinci dalam preprint arXiv di https://arxiv.org/abs/1609.01117 ) di mana entropi gambar dihitung dari histogram gradien 2D (fungsi kepadatan probabilitas gradien).
Pertama-tama pdf 2D dihitung dengan estimasi binning dari gambar x dan turunannya. Ini menyerupai operasi binning yang digunakan untuk menghasilkan histogram intensitas yang lebih umum dalam 1D. Derivatif dapat diperkirakan dengan perbedaan hingga 2-pixel yang dihitung dalam arah horizontal dan vertikal. Untuk gambar kotak NxN f (x, y) kami menghitung nilai NxN dari turunan parsial fx dan nilai NxN dari fy. Kami memindai melalui gambar diferensial dan untuk setiap piksel yang kami gunakan (fx, fy) untuk menemukan nampan terpisah dalam array tujuan (2D pdf) yang kemudian ditambahkan oleh satu. Kami ulangi untuk semua piksel NxN. 2D pdf yang dihasilkan harus dinormalisasi untuk memiliki probabilitas satuan keseluruhan (cukup dengan membagi oleh NxN untuk mencapai ini). 2D pdf sekarang siap untuk tahap selanjutnya.
Perhitungan entropi informasi Shannon 2D dari 2D gradient pdf sederhana. Rumus penjumlahan logaritmik klasik Shannon berlaku secara langsung kecuali untuk faktor penting setengah yang berasal dari pertimbangan pengambilan sampel terbatas pita khusus untuk gambar gradien (lihat makalah arXiv untuk perincian). Setengah faktor membuat entropi 2D yang dikomputasi bahkan lebih rendah dibandingkan dengan metode lain (lebih redundan) untuk memperkirakan entropi 2D atau kompresi lossless.
Maaf saya belum menulis persamaan yang diperlukan di sini, tetapi semuanya tersedia dalam teks pracetak. Komputasi bersifat langsung (non-iteratif) dan kompleksitas komputasinya teratur (jumlah piksel) NxN. Entropi informasi Shannon akhir yang dihitung adalah rotasi independen dan sesuai dengan jumlah bit yang diperlukan untuk menyandikan gambar dalam representasi gradien yang tidak redundan.
Omong-omong, ukuran entropi 2D yang baru memprediksi entropi (menyenangkan secara intuitif) 8 bit per piksel untuk gambar acak dan 0.000 bit per piksel untuk gambar gradien halus dalam pertanyaan awal.