Ini lebih merupakan komentar yang diperluas, jadi anggaplah demikian. Definisikan:
(saya menggunakan standar notasi untuk distribusi Gaussian).
f( x ) ≡1n∑i = 1nN( x |xsaya,σ2saya)
Anda ingin membuktikan bahwa:
yang
1n∑i = 1ncatatanf(xsaya) - ∫f( x ) logf( x ) dx ≥ 0
{1n∑i = 1ncatatanf(xsaya) } + H [ f] ≥ 0.
Karena ketidaksetaraan Jensen (lihat misalnya Huber et al., Tentang Entropy Approximation for Gaussian Mixture Random Vektor, 2008 ),
dengan , yang berasal dari konvolusi dua kepadatan Gaussian. Jadi kita dapatkan:
Menariknya, masih merupakan campuran dari Gaussians dengan rata-rata komponen sama dengan yang ada di
H [f] ≥ -1n∑i = 1ncatatan∫f( x ) N( x |xsaya,σ2saya) dx = -1n∑i = 1ncatatangsaya(xsaya)
gsaya( x ) ≡1n∑nj = 1N( x |xj,σ2saya+σ2j){1n∑i = 1ncatatanf(xsaya) } + H [ f] ≥1n∑i = 1ncatatanf(xsaya)gsaya(xsaya).
gsayaf, tetapi masing-masing komponen memiliki varians yang benar-benar lebih besar daripada komponen terkait di . Bisakah Anda melakukan sesuatu dengan ini?
gsayaf