Jika data , yaitu, n -sequence dari ruang sampel X , probabilitas titik empiris
p ( x ) = 1xn= x1... xnnX
untukx∈X. Di siniδx(xi)adalah satu jikaxi=xdan nol sebaliknya. Artinya, p (x)adalah frekuensi relatifxdi urutan diamati. Theentropidari distribusi probabilitas yang diberikan oleh probabilitas titik empiris adalah
H( p )=-Σ
hal^( x ) = 1n| {i∣ xsaya= x } | = 1n∑i = 1nδx( xsaya)
x ∈ Xδx( xsaya)xsaya= xhal^( x )x
Identitas kedua mengikuti dengan mempertukarkan dua jumlah dan mencatat bahwa
Σx∈ X δx(xi)log p (x)=log p (xi).
Dari sini kita melihat bahwa
H( p )=-1H( hal^) = - Âx ∈ Xhal^( x ) loghal^( x ) = - ∑x ∈ X1n∑i = 1nδx( xsaya) loghal^( x ) = - 1n∑i = 1ncatatanhal^( xsaya) .
∑x ∈ Xδx( xsaya) loghal^( x ) = loghal^( xsaya) .
dengan
p (xn)=Π n i = 1 p (xi)dan menggunakan terminologi dari pertanyaan ini adalah entropi empiris dari
distribusi probabilitas empiris. Seperti yang ditunjukkan oleh @ cardinal dalam komentar,
-1H( hal^) = - 1ncatatanhal^( xn)
hal^( xn) = ∏ni = 1hal^( xsaya)adalah entropi empiris dari distribusi probabilitas yang diberikan dengan probabilitas titik
p.
- 1ncatatanp ( xn)hal