Batas bawah pada estimasi


11

Saya ingin tahu (terkait dengan pertanyaan lain ini ) apakah batas bawah diketahui untuk masalah pengujian berikut: seseorang diberi akses permintaan ke urutan nomor non-negatif ana1 dan ε(0,1) , dengan janji bahwa k=1nak=1 atau k=1nak1ε .

Berapa banyak query (pencarian) yang cukup dan diperlukan untuk (adaptif) algoritma acak untuk membedakan antara dua kasus, dengan probabilitas setidaknya 2/3 ?

Saya telah menemukan posting sebelumnya yang memberikan batas atas logaritmik (dalam n ) untuk masalah terkait perkiraan jumlah, dan kira-kira pencocokan batas bawah pada masalah itu untuk algoritma deterministik; tetapi tidak dapat menemukan hasil untuk masalah spesifik yang saya pertimbangkan (khususnya, algoritma acak).


Sunting: Mengikuti jawaban di bawah ini, saya kira saya seharusnya lebih jelas: di atas (dan khususnya dalam asimptotik untuk batas bawah), n adalah kuantitas "utama" yang terlihat sebagai tak terhingga, sedangkan ε adalah (sewenang-wenang kecil) ) konstan.


Saya kira maksud Anda . k=1nak1ε
RB

Memang - memperbaikinya.
Clement C.

Nah, tanpa urutan ketergantungan pada akan diperlukan, saya rasa (dengan atau tanpa sampling). Sebuah "buruk" contoh (sepasang urutan) akan misalnya urutan dengan semua yang k 's yang sama dengan 1 - εnak , kecuali untuk satu (sewenang-wenang, random)jsehinggasebuahjadalah baik sama untukε(di urutan pertama) dan0(di kedua). TanpaΩ(n)query, dua sekuens tidak dapat dipisahkan ...1εn1jajε0Ω(n)
Clement C.

Saya berasumsi Model permintaan memungkinkan Anda untuk memilih yang Anda query sebuah k , apakah ini benar? kak
kodlu

Ya (Anda bisa memilih titik mana yang ingin Anda "ungkapkan").
Clement C.

Jawaban:


5

Inilah batas bawah yang bisa saya tunjukkan. Aku dugaan bahwa untuk tetap , hak batas bawah adalah Ω ( log n ) , tapi tentu saja aku mungkin salah.ϵΩ(logn)

Saya akan menggunakan urutan menurun (hanya untuk kenyamanan). Mekanisme dasarnya adalah memecah urutan menjadi blok Dalam blok ke- i akan ada elemen n i (yaitu, β i n i = n ).Liniini=n

Berikut ini, kami ingin algoritma berhasil dengan probabilitas , untuk beberapa parameter δ > 0 .1δδ>0

Batas bawah pertama: .Ω(1ϵlog1δ)

The blok th memiliki n i = 2 i - 1 elemen, sehingga L = lg n . Kami menetapkan nilai semua elemen di blok ke - i menjadi ( 1 + X i ) / ( 2 n i L ) , di mana X i adalah variabel yang bernilai 0 atau 1 . Jelas, jumlah total urutan ini adalah α = L Σ i = 1 1 + Xini=2i1L=lgni(1+Xi)/(2niL)Xi01 Bayangkan memilih setiapXidengan probabilitasβmenjadi1dan0sebaliknya. Untuk memperkirakanα, kita membutuhkan estimasiβ yangandal. Dalam partikulat, kami ingin dapat membedakan basisβ=1-4ϵdan, katakanlah,β=1.

α=i=1L1+Xi2niL=12+12L(i=1LXi).
Xiβ10αββ=14ϵβ=1

Sekarang, bayangkan sampel dari variabel-variabel acak, dan biarkan Z 1 , ... , Z m menjadi variabel sampel. Pengaturan Y = m i = 1 ( 1 - X i ) (perhatikan, bahwa kami mengambil jumlah variabel komplemen ), kami memiliki μ = E [ Y ] = ( 1 - β ) m , dan ketidaksamaan Chernoff memberi tahu kami bahwa jika β = 1 - 4mZ1,,ZmY=i=1m(1Xi)μ=E[Y]=(1β)m , maka μ = 4 ε m , dan probabilitas kegagalan adalah P [ Y 2 ε m ] = P [ Y ( 1 - 1 / 2 ) μ ]exp ( - μ ( 1 / 2 ) 2 / 2 ) = exp ( - ϵ m / 2 ) . Untuk membuat jumlah ini lebih kecil dariβ=14ϵμ=4ϵm

P[Y2ϵm]=P[Y(11/2)μ]exp(μ(1/2)2/2)=exp(ϵm/2).
, kita perlu m 2δ .m2ϵln1δ

Pengamatan utama adalah bahwa ketimpangan Chernoff ketat (kita harus hati-hati, karena tidak benar untuk semua parameter, tetapi itu benar dalam hal ini), sehingga Anda tidak dapat melakukan lebih baik dari itu (hingga konstanta).

Batas bawah kedua: .Ω(logn/loglogn)

Mengatur th ukuran blok menjadi n i = L i , di mana L = Θ ( log n / log log n ) adalah jumlah blok. Elemen dalam blok ke- i memiliki nilai α i = ( 1 / L ) / n i . Jadi jumlah total nilai dalam urutan adalah 1 .ini=LiL=Θ(logn/loglogn)iαi=(1/L)/ni1

Sekarang, kita mungkin memutuskan untuk memilih blok arbitrer, katakan yang , dan set semua nilai dalam bloknya menjadi α j - 1 = L α j (bukan α j ). Ini meningkat kontribusi dari j th blok dari 1 / L untuk 1 , dan meningkatkan massa total urutan ke (hampir) 2 .jαj1=Lαjαjj1/L12

Sekarang, secara informal, algoritma acak apa pun harus memeriksa nilai di masing-masing blok. Karena itu, ia harus membaca setidaknya nilai dari urutan.L

Untuk membuat argumen di atas lebih formal, dengan probabilitas , memberikan urutan asli dari massa 1 sebagai input (kita sebut ini sebagai masukan asli). Jika tidak, pilih secara acak blok yang memiliki nilai tambah (input yang dimodifikasi). Jelas, jika algoritma acak membaca kurang dari, katakanlah, L / 8 entri, ia memiliki probabilitas (kira-kira) 1 / 8 untuk mendeteksi input dimodifikasi. Dengan demikian, probabilitas algoritma ini gagal, jika membaca kurang dari entri L / 8 setidaknya ( 1 - p ) ( 7 /p=1/21L/81/8L/8

(1p)(7/8)>7/16>1/3.

PS Saya pikir dengan lebih berhati-hati tentang parameter, batas bawah pertama dapat ditingkatkan menjadi .Ω(1/ϵ2)


Terima kasih untuk ini! Saya punya pertanyaan kecil mengenai yang pertama, lb (lebih khusus kemungkinan perbaikan kuadratik). Karena kita memiliki masalah janji satu sisi di sini, yang menyiratkan bahwa begitu algoritma "melihat" nilai apa pun yang memberikan bukti bahwa β < 1 , ia dapat menyimpulkan tanpa harus mendapatkan perkiraan yang lebih akurat dari β : tidak yang berarti bahwa 1 / ε optimal untuk pembangunan ini, karena pada dasarnya yang diharapkan baik semua X i 's menjadi 1, atau setidaknya ε fraksi tidak menjadi? Ω(1/ϵ)β<1β1/ϵXiϵ
Clement C.

Ya. Jika Anda reli hanya ingin membedakan antara 1 dan 1-epsilon maka tentu saja Anda tidak dapat meningkatkan batas bawah ... Saya berpikir tentang mencoba membedakan rentang lain ... s
Sariel Har-Peled

4

Batas bawah

Ω(1/ϵ)

a1,,anϵ,2ϵ,3ϵ,4ϵ,na1++an=1n1/2ϵ

Sekarang buat urutan baru a1,,anϵa1=a1a2=a2ai=aiϵa1++an=1ϵ

a1,,ana1,,aniΩ(n)n1/2ϵΩ(1/ϵ)

Batas atas

O(lg(n/ϵ)[lgn+1/ϵ2])

[0,1]

[0,1]=[0,0.25ϵ/n](0.25ϵ/n,0.5ϵ/n](0.5ϵ/n,ϵ/n](ϵ/n,2ϵ/n](2ϵ/n,4ϵ/n](,1].

aiaiai[,u]i,jai,,aj[,u]O(lg(n/ϵ))

Sekarang, kami akan memperkirakan jumlah nilai di setiap rentang. Rentang pertama akan ditangani secara terpisah dari yang lainnya:

  • [0,0.25ϵ/n)0m×0.25ϵ/nmmn0.25ϵ

  • δO(1/δ2)2×δ=0.25ϵ

0.25ϵ0.25ϵ0.5ϵ11ϵ


Terima kasih - ini terlihat menarik (sejauh yang saya tahu, itu bukan pendekatan yang sama seperti yang digunakan dalam makalah / diskusi yang dikaitkan di atas), dan saya akan melihat lebih dalam pada apa yang Anda tulis. Namun, saya mencari batas bawah daripada batas atas - yaitu, berapa banyak permintaan yang diperlukan .
Clement C.

(Karena waktu sudah habis, saya menghadiahkan "karunia" untuk jawabannya - meskipun saya masih mencari referensi untuk batas bawah, jika ada satu tempat di sana.)
Clement C.

2
@ClementC., Saya menambahkan batas bawah, sesuai permintaan Anda.
DW

nε
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.