Tanpa mengutip sumber, Wikipedia mendefinisikan lintas-entropi dari distribusi diskrit dan Q menjadi
Siapa yang pertama kali mulai menggunakan jumlah ini? Dan siapa yang menemukan istilah ini? Saya melihat:
JE Shore dan RW Johnson, "Derivasi aksiomatik dari prinsip entropi maksimum dan prinsip cross-entropy minimum," Teori Informasi, Transaksi IEEE, vol. 26, tidak. 1, hlm. 26-37, Januari 1980.
Saya mengikuti pengantar mereka ke
A. Wehrl, "Sifat umum entropi," Ulasan Fisika Modern, vol. 50, tidak. 2, hlm. 221-260, April 1978.
yang tidak pernah menggunakan istilah ini.
Tidak juga
S. Kullback dan R. Leibler, "Tentang informasi dan kecukupan," The Annals of Mathematical Statistics, vol. 22, tidak. 1, hlm. 79-86, 1951.
Saya mencari
Sampul TM dan JA Thomas, Elemen Teori Informasi (Seri Wiley dalam Telekomunikasi dan Pemrosesan Sinyal). Wiley-Interscience, 2006.
dan
I. Baik, "Entropi Maksimum untuk Perumusan Hipotesis, Khususnya untuk Tabel Kontingensi Multidimensi," The Annals of Mathematical Statistics, vol. 34, tidak. 3, hlm. 911-934, 1963.
tetapi kedua makalah ini mendefinisikan cross-entropy untuk menjadi identik dengan KL-divergence.
Kertas asli
CE Shannon, "Teori Komunikasi Matematika," jurnal teknis sistem Bell, vol. 27, 1948.
Tidak menyebutkan cross entropy (dan memiliki definisi aneh tentang "entropi relatif": "Rasio entropi sumber dengan nilai maksimum yang bisa dimilikinya saat masih terbatas pada simbol yang sama").
Akhirnya, saya mencari di beberapa buku dan kertas tua karya Tribus.
Adakah yang tahu apa sebutan persamaan di atas, dan siapa yang menciptakannya atau memiliki presentasi yang bagus tentangnya?