Jarak statistik antara koin seragam dan bias


9

Misalkan adalah distribusi yang seragam di atas bit, dan misalkan menjadi distribusi di atas bit di mana bit tersebut independen dan setiap bit adalah dengan probabilitas . Benarkah jarak statistik antara dan adalah , ketika ?n D n 1 1 / 2 - ε D U Ω ( ε UnDn11/2ϵDUn1/ϵ2Ω(ϵn)n1/ϵ2


2
Iya. Jarak statistik antara dan setidaknya , yaitu ; lihat misalnya jawaban matus di sini: cstheory.stackexchange.com/questions/14471/…V P r U ( x i > n / 2 ) - P r D ( x i > n / 2 ) Ω ( ε UVPrU(xi>n/2)PrD(xi>n/2)Ω(εn)
Yury

2
Terima kasih. Mungkin menjelaskan bagaimana mendapatkan ini dari apa yang ditulis matus dalam jawaban yang bisa saya terima?
Manu


1
Mengenai jawaban Matus, Anda bisa melakukan lebih baik daripada ketidaksetaraan Slud; lihat (2.13.2.14) di arxiv.org/abs/1606.08920
Aryeh

Jawaban:


7

Nyatakan bit acak dengan . Menurut definisi, jarak statistik antara dan setidaknya untuk setiap . Kami memilih .x1,,xnUDPrU(xit)PrD(xit)tt=n/2+n

Perhatikan bahwa untuk beberapa konstanta absolut . Jika , maka jarak statistik setidaknya , dan kita selesai. Jadi kita asumsikan di bawah bahwa .PrU(xit)c1c1>0PrD(xit)c1/2c1/2PrD(xit)c1/2

Biarkan untuk variabel acak iid Bernoulli dengan . Tujuan kami adalah untuk membuktikan bahwa . Dengan teorema nilai rata-rata, untuk beberapa . Sekarang, kita akan membuktikan bahwa ; yang akan menyiratkan bahwa jarak statistik yang diinginkan setidaknya , seperti yang diperlukan.f(s)=Pr(xit)x1,,xnPr(xi=1)=1/2sf(0)f(ε)=Ω(εn)

f(0)f(ε)=εf(ξ),
ξ(0,ε)f(ξ)Ω(n)Ω(nε)

Tulis, dan Perhatikan bahwa Jadi,

f(ξ)=kt(nk)(12ξ)k(12+ξ)nk,
f(ξ)=kt(nk)(k(12ξ)k1(12+ξ)nk+(nk)(12ξ)k(12+ξ)nk1)=kt(nk)(12ξ)k(12+ξ)nkk/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ).
k/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ)=(2kn)/2+nξ(1/2ξ)(1/2+ξ)2(2tn)=4n.
f(ξ)4nkt(nk)(12ξ)k(12+ξ)nk=4nf(ξ)4nf(ε)4n(c1/2).
Di sini, kami menggunakan asumsi bahwa . Kami menunjukkan bahwa .f(ε)=PrD(x1++xnt)c1/2f(ξ)=Ω(n)

5

Bukti yang agak lebih mendasar, dan sedikit berantakan (atau setidaknya terasa begitu bagi saya).

Untuk kenyamanan, tulis , dengan dengan asumsi.ε=γnγ[0,1)

Kami secara eksplisit menurunkan ekspresi : dTV(P,U)

2dTV(P,U)=x{0,1}n|(12+γn)|x|(12γn)n|x|12n|=12nk=0n(nk)|(1+2γn)k(12γn)nk1|12nk=n2+nn2+2n(nk)|(1+2γn)k(12γn)nk1|Cnk=n2+nn2+2n|(1+2γn)k(12γn)nk1|
di mana adalah konstanta absolut. Kami menurunkan setiap ringkasan secara terpisah: memperbaiki , dan menulis , sehingga setiap summand lebih rendah dibatasi oleh jumlah yang menyatu (ketika ) keC>0k=kn2[n,2n]
(1+2γn)k(12γn)nk=(14γ2n)n/2(1+2γn12γn)(14γ2n)n/2(1+2γn12γn)nne4γ2γ2
ne4γ2γ21>4γ2γ2>2γ ; menyiratkan bahwa masing-masing adalah . Ringkasnya, ini menghasilkan seperti yang diklaim.Ω(γ)
2dTV(P,U)Cnk=n2+nn2+2nΩ(γ)=Ω(γ)=Ω(εn)

(Menggunakan Hellinger sebagai proksi karena sifatnya yang bagus distribusi produk yang menggoda, dan akan jauh lebih cepat, tetapi akan ada kerugian oleh faktor kuadrat di batas bawah ujung.)
Clement C.

1
Bagus! Saya suka pendekatan dasar. Kita harus dapat membuatnya non-asimptotik dalam juga .... salah satu caranya adalah dengan menggunakan , lalu gunakan ketidaksetaraan . Agak berantakan. n(1+z1z)n(1+2z)n1+weww2/2
usul
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.