Sampel penolakan akan bekerja dengan sangat baik ketika dan masuk akal untuk c d ≥ exp ( 2 ) .cd≥exp(5)cd≥exp(2)
Untuk sedikit menyederhanakan matematika, misalkan , tulis x = a , dan catat ituk=cdx=a
f(x)∝kxΓ(x)dx
untuk . Pengaturan x = u 3 / 2 memberikanx≥1x=u3/2
f(u)∝ku3/2Γ(u3/2)u1/2du
untuk . Ketika k ≥ exp ( 5 ) , distribusi ini sangat dekat dengan Normal (dan semakin dekat dengan k semakin besar). Secara khusus, Anda bisau≥1k≥exp(5)k
Temukan mode numerik (menggunakan, misalnya, Newton-Raphson).f(u)
Luaskan ke urutan kedua tentang modenya.logf(u)
Ini menghasilkan parameter dari distribusi Normal yang mendekati perkiraan. Untuk akurasi yang tinggi, Normal yang mendekati ini mendominasi kecuali pada ekor yang ekstrem. (Ketika k < exp ( 5 ) , Anda mungkin perlu meningkatkan pdf Normal sedikit untuk memastikan dominasi.)f(u)k<exp(5)
Setelah melakukan pekerjaan pendahuluan ini untuk setiap nilai diberikan , dan setelah memperkirakan konstanta M > 1 (seperti yang dijelaskan di bawah), memperoleh varian acak adalah masalah:kM>1
Gambarkan nilai dari distribusi Normal yang mendominasi g ( u ) .ug(u)
Jika atau jika baru seragam variate X melebihi f ( u ) / ( M g ( u ) ) , kembali ke langkah 1.u<1Xf(u)/(Mg(u))
Set .x=u3/2
Jumlah yang diharapkan dari evaluasi karena perbedaan antara g dan f hanya sedikit lebih besar dari 1. (Beberapa evaluasi tambahan akan terjadi karena penolakan varian kurang dari 1 , tetapi bahkan ketika k serendah 2 frekuensi seperti kejadiannya kecil.)fgf1k2
Plot ini menunjukkan dengan logaritma dari g dan f sebagai fungsi u untuk . Karena grafiknya sangat dekat, kita perlu memeriksa rasio mereka untuk melihat apa yang terjadi:k=exp(5)
Ini menampilkan log rasio ; faktor M = exp ( 0,004 ) dimasukkan untuk memastikan logaritma positif di seluruh bagian utama distribusi; yaitu, untuk memastikan M g ( u ) ≥ f ( u ) kecuali mungkin di daerah dengan probabilitas yang dapat diabaikan. Dengan membuat M cukup besar Anda dapat menjamin bahwa M ⋅ glog(exp(0.004)g(u)/f(u))M=exp(0.004)Mg(u)≥f(u)MM⋅ gmendominasi dalam semua kecuali ekor yang paling ekstrim (yang praktis tidak memiliki peluang untuk dipilih dalam simulasi). Namun, semakin besar M , semakin sering penolakan akan terjadi. Ketika k tumbuh besar, M dapat dipilih sangat dekat dengan 1 , yang praktis tidak ada penalti.fM.kM.1
Pendekatan serupa bekerja bahkan untuk , tetapi nilai-nilai M yang cukup besar mungkin diperlukan ketika exp ( 2 ) < k < exp ( 5 ) , karena f ( u ) terasa asimetris. Misalnya, dengan k = exp ( 2 ) , untuk mendapatkan g yang cukup akurat kita perlu menetapkan M = 1 :k > exp( 2 )M.exp( 2 ) < k < exp( 5 )f(u)k=exp(2)gM=1
Kurva merah atas adalah grafik sedangkan kurva biru bawah adalah grafik log ( f ( u ) ) . Sampel penolakan f relatif terhadap exp ( 1 ) g akan menyebabkan sekitar 2/3 dari semua penarikan uji coba ditolak, tiga kali lipat upaya: masih tidak buruk. Ekor kanan ( u > 10 atau x > 10 3 / 2 ~ 30log(exp(1)g(u))log(f(u))fexp(1)gu>10x>103/2∼30) akan kurang terwakili dalam sampel penolakan (karena tidak lagi mendominasi f di sana), tetapi ekor itu kurang dari exp ( - 20 ) ∼ 10 - 9 dari total probabilitas.exp(1)gfexp(−20)∼10−9
Untuk meringkas, setelah upaya awal untuk menghitung mode dan mengevaluasi istilah kuadrat dari rangkaian daya sekitar mode - upaya yang paling banyak membutuhkan beberapa evaluasi fungsi - Anda dapat menggunakan sampel penolakan di biaya yang diharapkan antara 1 dan 3 (atau lebih) evaluasi per varian. Pengganda biaya dengan cepat turun menjadi 1 karena k = c d meningkat melebihi 5.f(u)k=cd
Bahkan ketika hanya satu gambar dari diperlukan, metode ini masuk akal. Ia muncul dengan sendirinya ketika banyak undian independen diperlukan untuk nilai k yang sama , karena kemudian perhitungan awal diamortisasi selama banyak undian.fk
Tambahan
@ Cardinal telah meminta, cukup masuk akal, untuk mendukung beberapa analisis melambaikan tangan di masa depan. Secara khusus, mengapa harus transformasi make distribusi sekitar Normal?x=u3/2
Mengingat teori transformasi Box-Cox , adalah wajar untuk mencari beberapa transformasi kekuatan dari bentuk (untuk α yang konstan , semoga tidak terlalu berbeda dari persatuan) yang akan membuat distribusi "lebih" normal. Ingatlah bahwa semua distribusi Normal hanya ditandai: logaritma pdf mereka murni kuadratik, dengan nol istilah linear dan tanpa syarat pemesanan lebih tinggi. Oleh karena itu kita dapat mengambil pdf apa pun dan membandingkannya dengan distribusi normal dengan memperluas logaritma sebagai rangkaian daya di sekitar puncaknya (tertinggi). Kami mencari nilai α yang membuat (setidaknya) yang ketigax=uαααkekuatan lenyap, setidaknya kira-kira: itulah yang paling bisa kita harapkan bahwa satu koefisien bebas akan tercapai. Seringkali ini bekerja dengan baik.
Tetapi bagaimana cara menangani distribusi khusus ini? Setelah melakukan transformasi kekuatan, pdf-nya adalah
f(u)=kuαΓ(uα)uα−1.
Ambil logaritma dan menggunakan ekspansi asimtotik Stirling dari :log(Γ)
log(f(u))≈log(k)uα+(α−1)log(u)−αuαlog(u)+uα−log(2πuα)/2+cu−α
(untuk nilai , yang tidak konstan). Ini berfungsi asalkan α positif, yang akan kita anggap sebagai kasus (karena kalau tidak kita tidak dapat mengabaikan sisa ekspansi).cα
Hitung turunan ketiganya (yang bila dibagi , akan menjadi koefisien kekuatan ketiga u dalam seri daya) dan manfaatkan fakta bahwa pada puncaknya, turunan pertama harus nol. Ini sangat menyederhanakan turunan ketiga, memberi (kira-kira, karena kita mengabaikan turunan c )3!uc
−12u−(3+α)α(2α(2α−3)u2α+(α2−5α+6)uα+12cα).
Ketika tidak terlalu kecil, kamu memang akan besar di puncak. Karena α positif, istilah dominan dalam ungkapan ini adalah kekuatan 2 α , yang dapat kita atur menjadi nol dengan membuat koefisiennya menghilang:kuα2α
2α−3=0.
Itu sebabnya karya dengan baik: dengan pilihan ini, koefisien istilah kubik sekitar berperilaku puncak seperti u - 3 , yang dekat dengan exp ( - 2 k ) . Begitu k melebihi 10 atau lebih, Anda bisa melupakannya, dan itu cukup kecil bahkan untuk k turun ke 2. Kekuatan yang lebih tinggi, mulai dari yang keempat, memainkan peran yang semakin sedikit ketika k bertambah besar, karena koefisien mereka tumbuh secara proporsional lebih kecil juga. Kebetulan, perhitungan yang sama (berdasarkan turunan kedua dari l o g ( fα=3/2u−3exp(−2k)kkk pada puncaknya) menunjukkan standar deviasi dari perkiraan Normal ini sedikit kurang dari 2log(f(u)), dengan error sebanding denganexp(-k/2).23exp(k/6)exp(−k/2)