Definisi berbeda dari fungsi kehilangan lintas entropi


12

Saya mulai belajar tentang jaringan saraf dengan tutorial neuralnetworksanddeeplearning dot com. Khususnya di bab ke - 3 ada bagian tentang fungsi cross entropy, dan mendefinisikan cross entropy loss sebagai:

C=1nxj(yjlnajL+(1yj)ln(1ajL))

Namun, membaca pengantar Tensorflow , cross entropy loss didefinisikan sebagai:

(saat menggunakan simbol yang sama seperti di atas)C=1nxj(yjlnajL)

Kemudian mencari di sekitar untuk menemukan apa yang terjadi, saya menemukan satu set catatan: ( https://cs231n.github.io/linear-classify/#softmax-classifier ) yang menggunakan definisi yang sama sekali berbeda dari kehilangan entropi silang, meskipun ini waktu untuk pengklasifikasi softmax daripada untuk jaringan saraf.

Dapatkah seseorang menjelaskan kepada saya apa yang sedang terjadi di sini? Mengapa ada perbedaan btw. apa yang orang mendefinisikan kerugian lintas-entropi sebagai? Apakah hanya ada beberapa prinsip menyeluruh?


Jawaban:


18

Ketiga definisi ini pada dasarnya sama.

C=-1nxj(yjdalamSebuahj).

j=2

C=-1nx(y1dalamSebuah1+y2dalamSebuah2)
jSebuahj=1jyj=1
C=-1nx(y1dalamSebuah1+(1-y1)dalam(1-Sebuah1))

yyk

Cx=-j(yjdalamSebuahj)=-(0+0+...+ykdalamSebuahk)=-dalamSebuahk.

Cx=-dalam(Sebuahk)=-dalam(efkjefj).

0

Dalam bab ketiga , persamaan (63) adalah entropi silang yang diterapkan pada banyak sigmoids (yang mungkin tidak berjumlah 1) sedangkan dalam intro Tensoflow cross-entropy dihitung pada lapisan output softmax.

Sebagaimana dijelaskan oleh dontloo kedua formula pada dasarnya setara untuk dua kelas tetapi tidak ketika lebih dari dua kelas dipertimbangkan. Softmax masuk akal untuk multiklass dengan kelas eksklusif ( yaitu ketika hanya ada satu label per sampel, yang memungkinkan pengodean label satu-panas) sementara (banyak) sigmoids dapat digunakan untuk menggambarkan masalah multilabel (yaitu dengan sampel yang mungkin positif untuk beberapa kelas).

Lihat jawaban dontloo lainnya ini juga.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.