ysayacatatan( ysaya)
catatan( 0 )catatan( ysaya+ ϵ )
Hy′( y) : = - Âsayay′sayacatatan( ysaya)
Hy′( y) : = - Âsaya( y′sayacatatan( ysaya) + ( 1 - y′saya) log( 1 - ysaya) )
(a) benar untuk prediksi multi-kelas (sebenarnya merupakan penjumlahan ganda), (b) sama dengan (a) untuk prediksi dua-kelas. Keduanya saling entropi.
Contoh:
xsayac′saya∈ { 0 , 1 }csaya∈ [ 0 , 1 ]
c′sayacsaya
( c′saya, csaya) = { ( 0 , 0,1 ) , ( 0 , 0,4 ) , ( 0 , 0,8 ) , ( 1 , 0,8 ) , ( 1 , 0,2 ) }
y′sayaysaya
( y′saya, ysaya)
( y′saya, ysaya) = { ( [ 1 , 0 ] , [ 0,9 , 0,1 ] ) , ( [ 1 , 0 ] , [ 0,6 , 0,4 ] ) , ( [ 1 , 0 ] , [ 0,2 , 0,8 ] ) , ( [ 0 , 1 ] , [ 0,2 , 0,8 ] ) , ( [ 0 , 1 ] , [ 0.8 , 0.2 ] ) }
Baik (a) dan (b) dihitung sebagai:
Hy′( y) = - 1 / 5 ( [ l o g( 0,9 ) + l o g( 0,6 ) + l o g( 0,2 ) ]csaya= 0+ [ L o g( 0,8 ) + l o g( 0,2 ) ]csaya= 1) = 0,352
Penurunan:
1K
( xsaya, c′saya)c′saya= ky′saya= [ 0 , . . , 1 , 0 , . . ]kt hy′saya k= 1ysaya k= p ( k | xsaya)( xsaya, k )- l o g( ysaya k)ysaya k→ 1 ⇒ - l o g( ysaya k) → 0
L ( y′saya, ysaya) = - ÂKk = 1y′saya kl o g( ysaya k)
y′saya k= 1k′≠ k0 l o g( ysaya k′) = 0y′saya m= 1
L ( y′saya, ysaya) = - l o g( ysaya m)
Formula akhir untuk semua poin pelatihan adalah:
Hy′( y) = - Â( xsaya, y′saya)∑Kk = 1y′saya kl o g( ysaya k)
y′saya 0= 1 - y′saya 1ysaya 0= 1 - ysaya 1
Hy′( y)= - ∑( xsaya, y′saya)y′saya 1l o g( ysaya 1) + y′saya 0l o g( ysaya 0)= - ∑( xsaya, y′saya)y′saya 1l o g( ysaya 1) + ( 1 - y′saya 1) L o g( 1 - ysaya 1)
yang sama dengan (b).
Cross-entropy (a) atas kelas (satu penjumlahan)
Cross-entropy (a) atas kelas adalah:
Hy′( y) = - ÂKk = 1y′kl o g( yk)
Versi ini tidak dapat digunakan untuk tugas klasifikasi. Mari kita gunakan kembali data dari contoh sebelumnya:
( c′saya, csaya) = { ( 0 , 0,1 ) , ( 0 , 0,4 ) , ( 0 , 0,8 ) , ( 1 , 0,8 ) , ( 1 , 0,2 ) }
y′0= 3 / 5 = 0,6y′1= 0,4
y0= 3 / 5 = 0,6y1= 0,4
- y′0l o gy0- y′1l o gy1= - 0,6 l o g( 0,6 ) - 0,4 l o g( 0,4 ) = 0,292
( 0 , 0,8 )( 1 , 0,2 )y′0y′1
(c′saya,csaya) = { ( 0 , 0,1 ) , ( 0 , 0,4 ) , ( 0 , 0,2 ) , ( 1 , 0,8 ) , ( 1 , 0,8 ) }
y′0y0= 3 / 5