Generalisasi pertanyaan menanyakan distribusi ketika distribusi diketahui dan didukung pada bilangan asli. (Dalam pertanyaan, memiliki distribusi Poisson dari parameter dan .)Y=⌊X/m⌋X λ = λ 1 + λ 2 + ⋯ + λ n m = nXXλ=λ1+λ2+⋯+λnm=n
Distribusi mudah ditentukan oleh distribusi , yang kemungkinan menghasilkan fungsi (PGF) dapat ditentukan dalam hal PGF dari . Inilah garis besar derivasi tersebut.m Y XYmYX
Tulis untuk pgf , di mana (menurut definisi) . dibangun dari sedemikian rupa sehingga pgf, , adalahX p n = Pr ( X = n ) m Y X qp(x)=p0+p1x+⋯+pnxn+⋯Xpn=Pr(X=n)mYXq
q(x)=(p0+p1+⋯+pm−1)+(pm+pm+1+⋯+p2m−1)xm+⋯+(pnm+pnm+1+⋯+p(n+1)m−1)xnm+⋯.
Karena ini konvergen sepenuhnya untuk , kita dapat mengatur ulang istilah menjadi sejumlah potongan formulir|x|≤1
Dm,tp(x)=pt+pt+mxm+⋯+pt+nmxnm+⋯
untuk . Seri power dari fungsi terdiri dari setiap istilah dari seri dimulai dengan : ini kadang-kadang disebut penipisan dari . Pencarian Google saat ini tidak menghasilkan banyak informasi yang berguna tentang penipisan, jadi untuk kelengkapannya, inilah derivasi formula.x t D m , t p m th p t th pt=0,1,…,m−1xtDm,tpmthptthp
Biarkan menjadi akar persatuan primitif ; misalnya, ambil . Kemudian ia mengikuti dari dan yangm th ω = exp ( 2 i π / m ) ω m = 1 ∑ m - 1 j = 0 ω j = 0ωmthω=exp(2iπ/m)ωm=1∑m−1j=0ωj=0
xtDm,tp(x)=1m∑j=0m−1ωtjp(x/ωj).
Untuk melihat ini, perhatikan bahwa operator adalah linier, sehingga cukup untuk memeriksa rumus berdasarkan . Menerapkan sisi kanan untuk memberi { 1 , x , x 2 , ... , x n , ... } x nxtDm,t{1,x,x2,…,xn,…}xn
xtDm,t[xn]=1m∑j=0m−1ωtjxnω−nj=xnm∑j=0m−1ω(t−n)j.
Ketika dan berbeda dengan kelipatan , setiap istilah dalam jumlah sama dengan dan kita memperoleh . Kalau tidak, istilah-istilahnya siklus melalui kekuatan dan ini berjumlah nol. Mana Operator ini mempertahankan semua kekuatan kongruen dengan modulo dan membunuh semua yang lain: justru proyeksi yang diinginkan.tnm1xnωt−nxtm
Rumus untuk mengikuti dengan mudah dengan mengubah urutan penjumlahan dan mengenali salah satu penjumlahan sebagai geometris, sehingga menuliskannya dalam bentuk tertutup:q
q(x)=∑t=0m−1(Dm,t[p])(x)=∑t=0m−1x−t1m∑j=0m−1ωtjp(ω−jx)=1m∑j=0m−1p(ω−jx)∑t=0m−1(ωj/x)t=x(1−x−m)m∑j=0m−1p(ω−jx)x−ωj.
Sebagai contoh, pgf dari distribusi Poisson dari parameter adalah . Dengan , dan pgf dari akan menjadiλp(x)=exp(λ(x−1))m=2ω=−12Y
q(x)=x(1−x−2)2∑j=02−1p((−1)−jx)x−(−1)j=x−1/x2(exp(λ(x−1))x−1+exp(λ(−x−1))x+1)=exp(−λ)(sinh(λx)x+cosh(λx)).
Salah satu penggunaan pendekatan ini adalah untuk menghitung momen dan . Nilai turunan dari pgf yang dievaluasi pada adalah momen faktorial . The saat adalah kombinasi linear dari yang pertama saat faktorial. Dengan menggunakan pengamatan ini kami menemukan, misalnya, bahwa untuk Poisson didistribusikan , rata-rata (yang merupakan momen faktorial pertama) sama dengan , rata-rata sama dengan , dan rata-rata sama denganXmYkthx=1kthkthkXλ2⌊(X/2)⌋λ−12+12e−2λ3⌊(X/3)⌋λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2)) :
Berarti untuk ditunjukkan masing-masing dalam warna biru, merah, dan kuning, sebagai fungsi : asimtotik, rata-rata turun oleh dibandingkan dengan rata-rata Poisson asli.m=1,2,3λ(m−1)/2
Formula serupa untuk varians dapat diperoleh. (Mereka mendapatkan berantakan sebagai meningkat dan begitu juga dihilangkan Satu hal yang mereka definitif menetapkan adalah bahwa ketika. ada beberapa dari adalah Poisson: tidak memiliki persamaan karakteristik mean dan varians) Berikut adalah plot dari varians sebagai fungsi untuk :mm>1Yλm=1,2,3
Sangat menarik bahwa untuk nilai yang lebih besar dari varians meningkat . Secara intuitif, ini disebabkan oleh dua fenomena yang saling bersaing: fungsi lantai secara efektif menghilangkan kelompok nilai yang semula berbeda; ini harus menyebabkan varians menurun. Pada saat yang sama, seperti yang telah kita lihat, cara berubah juga (karena setiap bin diwakili oleh nilai terkecilnya); ini harus menyebabkan istilah yang sama dengan kuadrat dari perbedaan sarana untuk ditambahkan kembali. Peningkatan varian untuk besar menjadi lebih besar dengan nilai lebih besar .λλm
Perilaku varian dengan secara mengejutkan sangat kompleks. Mari kita akhiri dengan simulasi cepat (dalam ) yang menunjukkan apa yang dapat dilakukannya. Plot menunjukkan perbedaan antara varian dan varian untuk Poisson didistribusikan dengan berbagai nilai mulai dari hingga . Dalam semua kasus, plot tampaknya telah mencapai nilai asimptotiknya di sebelah kanan.mYmR
m⌊X/m⌋XXλ15000
set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
x <- rpois(20000, lambda)
v <- sapply(1:floor(lambda + 4*sqrt(lambda)),
function(m) var(floor(x/m)*m) - var(x))
plot(v, type="l", xlab="", ylab="Increased variance",
main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})