Saya berasumsi Anda dapat mengevaluasi dan hingga konstan normalisasi. Nyatakan dan .g f ( x ) = f u ( x ) / c f g ( x ) = g u ( x ) / c gfgf( x ) = fkamu( x ) / cfg( x ) = gkamu( x ) / cg
Pengukur yang konsisten yang dapat digunakan adalah
mana
adalah penaksir pengambilan sampel penting untuk rasio . Di sini Anda menggunakan dan masing-masing sebagai densitas instrumental untuk dan , dan untuk menargetkan rasio log dari kepadatan yang tidak dinormalisasi. r = 1 / n
DKL.ˆ( f| | g) = [ n- 1∑jfkamu( xj) / πf( xj) ]- 11N∑sayaN[ log( fkamu( zsaya)gkamu( zsaya)) fkamu( zsaya)πr( zsaya)] -log( r^)
cf/cgπfπgfuguπrr^= 1 / n1 / n∑jfkamu( xj) / πf( xj)∑jgkamu( yj)/ πg( yj).(1)
cf/ cgπfπgfkamugkamuπr
Jadi, biarkan , , dan . Pembilang (1) konvergen ke . Penyebut konvergen ke . Rasio ini konsisten dengan teorema pemetaan kontinu. Log rasio konsisten dengan pemetaan berkelanjutan lagi. { y i } ∼ π g { z i } ∼ π r c f c g{ xsaya} ∼ πf{ ysaya} ∼ πg{ zsaya} ∼ πrcfcg
Mengenai bagian lain dari estimator,
berdasarkan hukum angka besar.
1N∑sayaN[ log( fkamu( zsaya)gkamu( zsaya)) fkamu( zsaya)πr( zsaya)] →sebagaicfE[ log( fkamu( zsaya)gkamu( zsaya)) ]
Motivasi saya adalah sebagai berikut:
DKL.( f| | g)= ∫∞- ∞f( x ) log( f( x )g( x )) dx= ∫∞- ∞f( x ) { log[ fkamu( x )gkamu( x )] +log[ cgcf] } dx= Ef[ logfkamu( x )gkamu( x )] +log[ cgcf]= c- 1fEπr[ logfkamu( x )gkamu( x )fkamu( x )πr( x )] +log[ cgcf] .
Jadi saya memecahnya menjadi potongan-potongan yang bisa ditelusuri.
Untuk ide-ide lebih lanjut tentang cara mensimulasikan rasio likelhood, saya menemukan sebuah makalah yang memiliki beberapa:
https://projecteuclid.org/download/pdf_1/euclid.aos/1031594732