Membalikkan Chernoff


31

Apakah ada Chernoff terbalik yang terikat sehingga probabilitas ekor setidaknya begitu banyak.

yaitu jika adalah variabel acak binomial independen dan . Maka dapatkah kita membuktikan untuk beberapa fungsi . μ = E [ Σ n i = 1 X i ] P r [ Σ n i = 1 X i( 1 + δ ) μ ] f ( μ , δ , n ) fX1,X2,,Xnμ=E[i=1nXi]Pr[i=1nXi(1+δ)μ]f(μ,δ,n)f


1
Contoh Anda terlalu banyak bertanya: dengan , batas Chernoff standar menunjukkan bahwa dan \ Pr [| T \ cap S_2 | \ sqrt {1.1} \ leq n ^ {1/3}] paling banyak \ exp (-cn ^ { 1/3}) untuk beberapa c . p=n2/3Pr[|TS1|1.1n1/3]Pr[|TS2|1.1n1/3]exp(cn1/3)c
Colin McQuillan

Anda benar, saya bingung tentang istilah dalam chernoff terikat yang memiliki kuadrat. Saya telah mengubah pertanyaan untuk mencerminkan ikatan yang lebih lemah. Saya tidak berpikir itu akan membantu saya dalam aplikasi saya saat ini, tetapi mungkin menarik karena alasan lain.
Ashwinkumar BV

Jawaban:


28

Berikut adalah bukti eksplisit bahwa standar Chernoff terikat ketat hingga faktor konstan dalam eksponen untuk rentang parameter tertentu. (Secara khusus, setiap kali variabel 0 atau 1, dan 1 dengan probabilitas 1/2 atau kurang, dan ϵ(0,1/2) , dan batas atas Chernoff kurang dari konstanta.)

Jika Anda menemukan kesalahan, beri tahu saya.

Lemma 1. (sesaknya Chernoff terikat) Misalkan X menjadi rata-rata k independen, 0/1 variabel acak (rv). Untuk setiap ϵ(0,1/2] dan p(0,1/2] , dengan asumsi ϵ2pk3 ,

(i) Jika setiap rv adalah 1 dengan probabilitas paling banyak p , maka

Pr[X(1ϵ)p]  exp(9ϵ2pk).

(ii) Jika setiap rv adalah 1 dengan probabilitas setidaknya p , maka

Pr[X(1+ϵ)p]  exp(9ϵ2pk).

Bukti. Kami menggunakan observasi berikut:

Klaim 1. Jika , maka ( k1k1(k)  1e2π(k)(kk)k

Bukti Klaim 1. Dengan perkiraan Stirling, manaλ[1/(12i+1),1/12i].i!=2πi(i/e)ieλλ[1/(12i+1),1/12i].

Jadi, , yaitu , setidaknya QED k!(k)k!!(k)!1

2πk(ke)k2π(e)  2π(k)(ke)kexp(112k+1112112(k))
  12π(k)(kk)ke1.

Bukti Lemma 1 Bagian (i). Tanpa kehilangan generalitas, asumsikan setiap 0/1 variabel acak dalam jumlah adalah 1 dengan probabilitas tepat . Catatan sama dengan jumlah , dan .p Pr [ X ( 1 - ε ) p ] Σ ( 1 - ε ) p k i = 0 Pr [ X = i / k ] Pr [ X = i / k ] = ( kX pPr[X(1ϵ)p]i=0(1ϵ)pkPr[X=i/k]Pr[X=i/k]=(ki)pi(1p)ki

Perbaiki . Istilah dalam jumlah meningkat, sehingga istilah dengan indeks masing-masing memiliki nilai setidaknya , sehingga jumlah mereka memiliki nilai total setidaknya . Untuk melengkapi buktinya, kami menunjukkan bahwa i Pr [ X = / k ] ( ϵ p k - 2 ) Pr [ X = / k ] ( ϵ p k - 2 ) Pr [ X = / k ] exp ( - 9 ϵ=(12ϵ)pk+1iPr[X=/k](ϵpk2)Pr[X=/k]

(ϵpk2)Pr[X=/k]  exp(9ϵ2pk).

Asumsi dan memberi , sehingga sisi kiri di atas setidaknya . Menggunakan Klaim 1, untuk mengikat , ini pada gilirannya setidaknya mana dan ε 1 / 2 ε p k 6 2ϵ2pk3ϵ1/2ϵpk6(k23ϵpk(k)p(1p)k A(k)A = 2AB B= ( kA=23eϵpk/2πB=(k)(kk)kp(1p)k.

Untuk menyelesaikannya kami menampilkan dan .B exp ( - 8 ϵ 2 p k )Aexp(ϵ2pk)Bexp(8ϵ2pk)

Klaim 2. Aexp(ϵ2pk)

Bukti Klaim 2. Asumsi dan menyiratkan (i) .ε 1 / 2 p k 12ϵ2pk3ϵ1/2pk12

Menurut definisi, . Oleh (i), . Jadi, (ii) .p k 12 pk+1pk121.1pk

Mengganti sisi kanan (ii) untuk di memberi (iii) .A A 2AA23eϵpk/2.2π

Asumsinya, , menyiratkan , yang dengan (iii) memberikan (iv) .ϵ ϵ2pk3 A 2ϵpk3A23e3/2.2π0.1

Dari berikut bahwa (v) .exp ( - ϵ 2 p k ) exp ( - 3 ) 0,04ϵ2pk3exp(ϵ2pk)exp(3)0.04

(iv) dan (v) bersama-sama memberikan klaim. QED

Klaim 3. .Bexp(8ϵ2pk)

Bukti Klaim 3. Perbaiki sedemikian rupa sehingga . Pilihan menyiratkan , sehingga klaim akan berlaku selama . Mengambil setiap sisi dari ketidaksetaraan terakhir ini dengan kekuatan dan menyederhanakan, itu setara dengan Mengganti dan menyederhanakan, itu sama dengan = ( 1 - δ ) p k δ 2 ϵ B exp ( - 2 δ 2 p k ) - 1 /δ=(1δ)pk
δ2ϵBexp(2δ2pk)1/=(1-δ)pk(1-δ)(1+δp

pk(k(1p)k)k/1  exp(2δ2pk).
=(1δ)pkPada(1+z)z-δ
(1δ)(1+δp1p)1(1δ)p1  exp(2δ21δ).
Mengambil logaritma dari kedua sisi dan menggunakan dua kali, itu akan tahan selama Sisi kiri di atas menyederhanakan menjadi , yang kurang dari karena . QEDln(1+z)zδ2/
δ+δp1p(1(1δ)p1)  2δ21δ.
2 δ 2 / ( 1 - δ ) p 1 / 2δ2/(1p)(1δ)2δ2/(1δ)p1/2

Klaim 2 dan 3 menyiratkan . Ini menyiratkan bagian (i) dari lemma.ABexp(ϵ2pk)exp(8ϵ2pk)

Bukti Lemma 1 Bagian (ii). Tanpa kehilangan keumuman menganggap setiap variabel acak adalah dengan probabilitas tepat .hal1p

Catatan . Perbaiki . = ( 1 + 2 ε ) p k - 1Pr[X(1+ϵ)p]=i=(1ϵ)pknPr[X=i/k]^=(1+2ϵ)pk1

Istilah terakhir dalam jumlah total setidaknya , yang setidaknya . (Buktinya sama dengan untuk (i), kecuali dengan digantikan oleh dan digantikan oleh sehingga .) QED( ε p k - 2 ) Pr [ X = / k ] exp ( - 9 ε 2 p k ) δ - δ = ( 1 + δ ) p kϵpk(ϵpk2)Pr[X=^/k]exp(9ϵ2pk)^δδ^^=(1+δ^)pk


Beberapa [kesalahan pemrosesan matematika] s - ada kemungkinan memperbaikinya?
Aryeh

Ekspresi matematika yang digunakan untuk menampilkan dengan baik. Untuk beberapa alasan perintah \ select tidak berfungsi di mathjax. Juga tidak ada \ binom. Misal $ a \ pilih b $ beri . Agaknya ini adalah bug dalam konfigurasi mathjax. Semoga akan segera diperbaiki. Sementara itu lihat Lemma 5.2 dalam lampiran arxiv.org/pdf/cs/0205046v2.pdf atau cs.ucr.edu/~neal/Klein15Number . (ab)
Neal Young

22

The Berry-Esseen teorema dapat memberikan batas ekor probabilitas rendah, selama mereka lebih tinggi dari .n1/2

Alat lain yang bisa Anda gunakan adalah ketimpangan Paley-Zygmund . Ini menyiratkan bahwa untuk setiap bahkan bulat , dan setiap bernilai real variabel acak ,XkX

Pr[|X|>=12(E[Xk])1/k]E[Xk]24E[X2k]

Bersama dengan teorema multinomial, untuk sejumlah variabel acak Rademacher Paley-Zygmund bisa mendapatkan batas bawah cukup kuat. Juga bekerja dengan variabel acak terikat-kemerdekaan. Misalnya, Anda dengan mudah mendapatkan bahwa jumlah variabel acak acak bebas adalah dengan probabilitas konstan.n n ± 1 Ω ( Xnn±1Ω(n)


14

Jika Anda memang setuju dengan jumlah percobaan Bernoulli (dan tidak, katakanlah, variabel acak terbatas), berikut ini cukup ketat.

Ketimpangan Ketidaksamaan *. Biarkan menjadi menarik dari Bernoulli rv dengan , dan biarkan bilangan bulat diberikan. Jika (a) dan , atau (b) , maka mana adalah cdf dari standar normal. E ( X 1 ) = p k n p 1 / 4 n p k n p k n ( 1 - p ) Pr [ Σ i X ik ]1 - Φ ( k - n p{Xi}i=1nE(X1)=pknp1/4npknpkn(1p)Φ

Pr[iXik]1Φ(knpnp(1p)),
Φ

(Memperlakukan argumen pada sebagai mentransformasikan standar normal, ini sesuai persis dengan apa yang CLT katakan kepadamu; pada kenyataannya, ini memberitahu kita bahwa Binomial yang memenuhi kondisi teorema akan mendominasi Gaussians yang sesuai pada ekor atas.)Φ

Dari sini, Anda dapat menggunakan batas pada untuk mendapatkan sesuatu yang lebih bagus. Misalnya, dalam buku pertama Feller, di bagian Gaussians, ditunjukkan untuk setiap yang mana adalah kepadatan standar normal. Ada batasan serupa di artikel Wikipedia untuk "Q-function" juga.z > 0 zΦz>0φ

z1+z2φ(z)<1Φ(z)<1zφ(z),
φ

Selain itu, dan apa yang dikatakan orang lain, Anda juga dapat mencoba menggunakan Binomial secara langsung, mungkin dengan beberapa Stirling.

(*) Beberapa pernyataan ketidaksetaraan Slud yang terbaru mengabaikan beberapa kondisi ini; Saya sudah mereproduksi satu di kertas Slud.


7

Teorema de Moivre-Laplace menunjukkan bahwa variabel-variabel seperti, setelah dinormalisasi dan dalam kondisi tertentu, akan menyatu dalam distribusi ke distribusi normal. Itu cukup jika Anda ingin batas bawah konstan.|TS1|

Untuk batas bawah seperti , Anda memerlukan alat yang sedikit lebih baik. Inilah satu referensi yang saya tahu (tetapi hanya secara kebetulan - saya sendiri tidak pernah memiliki kesempatan untuk menggunakan ketidaksetaraan seperti itu). Beberapa batas bawah eksplisit pada probabilitas ekor dari distribusi binomial diberikan sebagai Teorema 1.5 buku grafik Acak oleh Béla Bollobás, Cambridge, edisi ke-2, di mana referensi lebih lanjut diberikan pada Pengantar probabilitas dan penerapannya oleh Feller dan Foundations of Probability oleh Rényi.nc


4

Teorema Littlewood-Offord Generalized tidak tepat seperti yang Anda inginkan, tetapi memberikan apa yang saya anggap sebagai "Chernoff terbalik" terikat dengan menunjukkan bahwa jumlah variabel acak tidak mungkin jatuh dalam kisaran kecil di sekitar nilai tertentu (termasuk harapan). Mungkin itu akan bermanfaat.

Secara formal, teorema adalah sebagai berikut.

Teorema Littlewood-Offord Generalized : Biarkan , dan menjadi bilangan real sedemikian rupa sehingga untuk dan biarkan menjadi variabel acak independen yang memiliki nilai nol dan satu. Untuk , misalkan untuk semua . Kemudian, untuk setiap , Di mana adalah konstanta hanya bergantung pada .a1,,ans>0|ai|s1inX1,,Xn0<p12pPr[Xi=0]1p1inrR

Pr[ri=1naiXi<r+s]cpn
cpp

3
Mungkin bermanfaat bagi orang lain untuk mengetahui bahwa jenis hasil ini juga dikenal sebagai "ketimpangan bola kecil" dan Nguyen dan Vu memiliki survei hebat people.math.osu.edu/nguyen.1261/cikk/LO-survey.pdf . Perspektif saya di sini sedikit berbeda dari Anda. Saya berpikir tentang "membalikkan Chernoff" terikat sebagai memberikan perkiraan yang lebih rendah dari massa probabilitas bola kecil di sekitar 0. Saya berpikir tentang ketidakmerataan bola kecil secara kualitatif mengatakan bahwa probabilitas bola kecil dimaksimalkan oleh bola di 0. Dalam hal ini sense reverse batas Chernoff biasanya lebih mudah dibuktikan daripada ketidakmerataan bola kecil.
Sasho Nikolov

3

Eksponen dalam standar Chernoff terikat seperti yang dinyatakan di Wikipedia ketat untuk variabel acak bernilai 0/1. Misalkan dan biarkan menjadi urutan variabel acak independen sehingga untuk setiap , dan . Kemudian untuk setiap , 0<p<1X1,X2,iPr[Xi=1]=pPr[Xi=0]=1pε>0

2D(p+εp)nn+1Pr[i=1nXi(p+ε)n]2D(p+εp)n.

Di sini, , yang merupakan perbedaan Kullback-Leibler antara Bernoulli secara acak variabel dengan parameter dan .D(xy)=xlog2(x/y)+(1x)log2((1x)/(1y))xy

Seperti disebutkan, batas atas dalam ketidaksetaraan di atas dibuktikan di Wikipedia ( https://en.wikipedia.org/wiki/Chernoff_bound ) dengan nama "Chernoff-Hoeffding Theorem, bentuk aditif". Batas bawah dapat dibuktikan menggunakan misalnya "metode tipe". Lihat Lemma II.2 dalam [1]. Juga, ini tercakup dalam buku teks klasik tentang teori informasi oleh Cover dan Thomas.

[1] Imre Csiszár: Metode Jenis. Transaksi IEEE pada Teori Informasi (1998). http://dx.doi.org/10.1109/18.720546


Perlu juga dicatat bahwa , dan untuk kasus umum itu adalah . Ini menunjukkan bahwa ketika khas terikat tajam. (Dan ketika untuk ). D(p+δpp)=p22pδ2+O(δ3)p=1/2δ=O(n-1/3)e-Cδ2δ=O(n-1/4)p=1/212δ2+O(δ4)δ=O(n1/3)eCδ2δ=O(n1/4)p=1/2
Thomas Ahle
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.