Teori Informasi digunakan untuk membuktikan pernyataan kombinasi yang rapi?


54

Apa contoh favorit Anda di mana teori informasi digunakan untuk membuktikan pernyataan kombinatorial yang rapi dengan cara sederhana?

Beberapa contoh yang dapat saya pikirkan terkait untuk menurunkan batas untuk kode lokal decodable, misalnya, dalam hal ini kertas: misalkan untuk sekelompok string biner x1,...,xm panjang yang menyatakan bahwa untuk setiap , untuk pasangan berbeda { },Maka m setidaknya eksponensial dalam n, di mana eksponen bergantung secara linear pada rasio rata-ratanikij1,j2

ei=xj1xj2.
ki/m .

Contoh (terkait) lainnya adalah beberapa ketimpangan isoperimetrik pada kubus Boolean (jangan ragu untuk menguraikan ini dalam jawaban Anda).

Apakah Anda memiliki contoh yang lebih bagus? Lebih disukai, pendek dan mudah dijelaskan.


dapatkah seseorang memberikan referensi pada "Contoh lain (terkait) adalah beberapa ketidaksetaraan isoperimetrik pada kubus Boolean"?
vzn

Jawaban:


40

Moser bukti Lovasz Local Lemma yang konstruktif . Dia pada dasarnya menunjukkan bahwa, di bawah kondisi lemma lokal, algoritma paling sederhana kedua untuk SAT Anda dapat memikirkan karya. (Yang paling sederhana mungkin adalah dengan hanya mencoba tugas acak sampai satu bekerja. Yang paling sederhana adalah mengambil memilih tugas acak, menemukan klausa yang tidak puas, memenuhinya, lalu melihat apa klausa lain yang Anda bongkar, kembalikan, dan ulangi sampai selesai.) Bukti bahwa ini berjalan dalam waktu polinomial mungkin adalah penggunaan teori informasi yang paling elegan (atau kompleksitas Kolmogorov, apa pun yang Anda inginkan dalam hal ini) yang pernah saya lihat.


1
Bukti kompleksitas Kolmogorov yang indah dari Moser dijelaskan di sini: blog.computationalcomplexity.org/2009/06/... , tetapi saya harus mengakui bahwa saya mencari lebih banyak jenis entropi / informasi bersama / perhitungan contoh ...
Dana Moshkovitz

Ada beberapa aplikasi yang cukup menarik dari kompleksitas Kolmogorov yang diberikan sebagai jawaban untuk pertanyaan ini: cstheory.stackexchange.com/questions/286
arnab

Terry Tao juga membahas argumen Moser di blog-nya: terrytao.wordpress.com/2009/08/05/...
Anthony Leverrier

5
Sebenarnya, dalam makalah keduanya (dengan Tardos) Anda tidak lagi membutuhkan jalan lain untuk rekursi. Anda hanya mencari klausa yang tidak puas, pilih tugas acak untuk variabel-variabelnya, dan iterate . Itu dia. Untuk beberapa alasan algoritma yang lebih sederhana (memiliki analisis yang sama) tidak macet.
Yuval Filmus

@DanaMoshkovitz: Saya tidak tahu mengapa ini tidak terjadi pada saya untuk mengatakan lebih cepat dalam menanggapi komentar Anda: Kompleksitas dan entropi Kolmogorov, dalam banyak hal, pada dasarnya setara. Lihat misalnya Hammer-Romaschenko-Shen-Vershchagin: dx.doi.org/10.1006/jcss.1999.1677 . Sebagai contoh, berdasarkan [HRSV], bukti Lemma Shearer dalam jawaban arnab dapat dibuktikan dengan bukti yang pada dasarnya sama dengan menggunakan kompleksitas Kolmogorov sebagai pengganti entropi. Perbedaannya hanya sudut pandang: K adalah tentang panjang deskripsi, H adalah tentang ... Kadang-kadang yang lebih mudah / lebih alami dari yang lain. pilogpi
Joshua Grochow

33

Contoh favorit saya dari jenis ini adalah bukti berbasis entropi dari Shearer's Lemma. (Saya mempelajari bukti ini dan beberapa yang sangat cantik dari Entropi dan Penghitungan Jaikumar Radhakrishnan .)

Klaim: Misalkan Anda memiliki poin dalam R 3 yang memiliki n x proyeksi berbeda pada bidang y z , n y proyeksi berbeda pada bidang x z dan n z proyeksi berbeda pada bidang x y . Kemudian, n 2n x n y n znR3nxyznyxznzxyn2nxnynz .

Bukti: Misalkan menjadi titik yang dipilih secara acak dari titik n . Misalkan p x , p y , p z menunjukkan proyeksi ke masing-masing bidang y z , x z dan x y . p=(x,y,z)npxpypzyzxzxy

Di satu sisi, , H [ p x ] log n x , H [ p y ] log n y dan H [ p z ] log n z , berdasarkan sifat dasar entropi.H[p]=lognH[px]lognxH[py]lognyH[pz]lognz

Di sisi lain, kita memiliki dan juga H [ p x ] = H [ y ] + H [ z | y ] H [ p y ] = H [ x ] + H [ |

H[p]=H[x]+H[y|x]+H[z|x,y]
H[px]=H[y]+H[z|y]
H [ p z ] = H [ x ] + H [ y | x ] Menambahkan tiga persamaan terakhir memberi kita: H [ p x ] + H [ p y ] + H [ p z ] = 2 H [ x ] + H [ y ] + H [ y | x ] + H
H[py]=H[x]+H[z|x]
H[pz]=H[x]+H[y|x]
H[px]+H[py]+H[pz]= 2H[x]+H[y]+ H[y|x]+ + H [ z | y ] 2 H [ x ] + 2 H [ y | x ] + 2 H [ z | x , y ] = 2 H [ p ] , di mana kami menggunakan fakta bahwa pengkondisian menurunkan entropi (secara umum, H [ a ] H [ a | b ]H[z|x] +H[z|y] 2H[x]+2H[y|x]+2H[z|x,y]= 2H[p]H[a]H[a|b]untuk variabel acak ).a,b

Jadi, kita memiliki , atau n 2n x n y n z .2lognlognx+logny+lognzn2nxnynz


6
Makalah terkait yang perlu diperiksa adalah 'Hypergraph, Entropy, dan Ketimpangan' oleh Ehud Friedgut. Ini menunjukkan bagaimana perspektif entropi, khususnya Lemma Shearer yang digeneralisasi, dapat dengan mudah memulihkan banyak ketidaksetaraan standar, dan juga beberapa yang tidak standar, tampak rumit. Saya pikir itu memberikan perspektif yang menerangi. Tautan: ma.huji.ac.il/ ~ehudf
Andy Drucker

26

Bukti entropi Radhakrishnan tentang Teorema Bregman, bahwa jumlah kecocokan sempurna dalam grafik bipartit ( L R , E ) paling banyak adalah v L ( d ( v ) ! ) 1 / d ( v ) . Buktinya menggunakan dua ide yang sangat pintar. Berikut ini sketsa buktinya:p(LR,E)vL(d(v)!)1/d(v)

  • Pilih cocok sempurna secara seragam. Entropi dari variabel ini adalah H ( M ) = log p .MH(M)=logp
  • Untuk , misalkan X v menjadi simpul dalam R yang cocok dengan v dalam MvLXvRvM .
  • Variabel memiliki informasi yang sama dengan M , jadi H ( M ) = H ( X ) .X=(Xv:vL)MH(M)=H(X)
  • Pintar Idea 1: Dengan secara acak (dan seragam) memilih perintah pada L , Radhakrishnan menyediakan "acak rantai aturan" yang menyatakan H ( X ) = Σ v L H ( X v | X u : u < v , ) .LH(X)=vLH(Xv|Xu:u<v,)
  • Dari informasi dalam kondisi ( ) kita dapat menentukan N v = | N ( v ) X u : u < v | (kira-kira: jumlah pilihan untuk pencocokan v ).Xu:u<v,Nv=|N(v)Xu:u<v|v
  • Sejak ditentukan dari informasi ini, entropi terkondisi tidak berubah dalam kesetaraan H ( X v | X u : u < v , ) = H ( X v | X u : u < v , , N v ) .NvH(Xv|Xu:u<v,)=H(Xv|Xu:u<v,,Nv)
  • Ide Pintar 2: Dengan "melupakan" informasi , kita hanya dapat meningkatkan entropi: H ( X v | X u : u < v , , N v ) H ( X v | N v ) .Xu:u<v,H(Xv|Xu:u<v,,Nv)H(Xv|Nv)
  • Crazy Fact: Variabel didistribusikan secara seragam pada set 1 , , d ( v ) .Nv1,,d(v)
  • Sekarang, untuk menghitung entropi , kita menjumlahkan seluruh nilai-nilai N v : H ( X v | N v ) = Σ d ( v ) i = 1 1H(Xv|Nv)NvH(Xv|Nv)=i=1d(v)1d(v)H(Xv|Nv=i)1d(v)i=1d(v)logi=log((d(v)!)1/d(v)).
  • Hasilnya mengikuti dengan menggabungkan semua ketidaksetaraan bersama-sama dan mengambil eksponen.

Generalisasi ketimpangan ini adalah Kahn-Lovasz Teorema: Jumlah matchings sempurna dalam grafik setiap adalah paling Π v V ( G ) ( d ( v ) ! ) 1 / 2 d ( v ) . Bukti entropi dari hasil ini dibuktikan oleh Cutler dan Radcliffe .GvV(G)(d(v)!)1/2d(v)


1
Contoh yang bagus! Poin kecil: Ketika Anda memperkirakan , Anda mungkin hanya bisa mengatakan bahwa H ( X vN v = i ) dibatasi oleh log i . H(XvNv)H(XvNv=i)logi
Srikanth

Anda benar sekali dan saya sudah mengedit jawaban untuk menggunakan ketidaksetaraan.
Derrick Stolee

20

Contoh-contoh yang sangat bagus terdapat dalam dua makalah oleh Pippenger An Information-Theoretic Method dalam Combinatorial Theory. J. Comb. Teori, Ser. A 23 (1): 99-104 (1977) dan Entropy dan enumerasi fungsi boolean. Transaksi IEEE tentang Teori Informasi 45 (6): 2096-2100 (1999). Sebenarnya, beberapa makalah oleh Pippenger berisi bukti lucu tentang fakta kombinatorial dengan cara entropi / informasi timbal balik. Juga, dua buku: Jukna, Extremal Combinatorics With Applications in Computer Science and Aigner, Combinatorial Search memiliki beberapa contoh yang bagus. Saya juga suka dua makalah Madiman et al. Ketidakseimbangan teori-informasi dalam Kombinatorik Aditif, dan Terence Tao, perkiraan jumlah Entropy (Anda dapat menemukannya dengan Google Cendekia). Semoga ini bisa membantu.


Sepertinya daftar bacaan yang bagus!
Dana Moshkovitz

17

Contoh hebat lainnya adalah bukti alternatif Terry Tao dari lemma keteraturan grafik Szemerédi . Dia menggunakan perspektif informasi-teoretis untuk membuktikan versi kuat dari lemma keteraturan, yang ternyata sangat berguna dalam pembuktiannya tentang lemma keteraturan untuk hypergraphs . Sejauh ini, bukti Tao adalah bukti paling ringkas untuk keteraturan keteraturan hypergraph.

Izinkan saya mencoba menjelaskan pada perspektif teori-informasi yang sangat tinggi ini.

Misalkan Anda memiliki graf bipartit , dengan dua set vertex V 1 dan V 2 dan tepi set E subset dari V 1 × V 2 . Kepadatan tepi G adalah ρ = | E | / | V 1 | | V 2 | . Kita mengatakan G adalah ε -regular jika untuk semua U 1V 1 dan U 2V 2GV1V2V1×V2Gρ=|E|/|V1||V2|GϵU1V1U2V2, kerapatan tepi dari subgraph yang diinduksi oleh dan U 2 adalah ρ ± ϵ | U 1 | | U 2 | / | V 1 | | V 2 |U1U2ρ±ϵ|U1||U2|/|V1||V2|.

Sekarang, pertimbangkan untuk memilih titik dari V 1 dan titik x 2 dari V 2 , secara independen dan seragam secara acak. Jika ϵ kecil dan U 1 , U 2 besar, kita dapat mengartikan ϵ- regularitas G sebagai mengatakan bahwa pengkondisian x 1 berada di U 1 dan x 2 berada di U 2 tidak mempengaruhi banyak kemungkinan bahwa ( x 1 , x 2x1V1x2V2ϵU1,U2ϵGx1U1x2U2(x1,x2)membentuk keunggulan dalam . Dengan kata lain, bahkan setelah kami diberi informasi bahwa x 1 ada di U 1 dan x 2 ada di U 2 , kami belum memperoleh banyak informasi tentang apakah ( x 1 , x 2 )Gx1U1x2U2(x1,x2) keunggulan atau tidak.

The Szemeredi keteraturan lemma (informal) jaminan bahwa untuk setiap grafik, satu dapat menemukan partisi dari dan partisi dari V 2 menjadi himpunan bagian dari kepadatan konstan sehingga untuk sebagian besar pasangan seperti subset U 1V 1 , U 2V 2 , subgraph yang diinduksi pada U 1 × U 2 adalah ϵ- regular. Membuat interpretasi di atas, diberikan dua variabel entropi tinggi x 1 dan x 2 , dan diberi peristiwa E ( xV1V2U1V1,U2V2U1×U2ϵx1x2 , adalah mungkin untuk menemukan variabel entropi rendah U 1 ( x 1 ) dan U 2 ( x 2 ) - "entropi rendah" karena himpunan bagian U 1 dan U 2 memiliki kepadatan konstan - seperti bahwa E kira-kira tidak tergantung pada x 1 | U 1 dan x 2 | U 2E(x1,x2)U1(x1)U2(x2)U1U2Ex1|U1x2|U2, atau bahwa informasi timbal balik antara variabel sangat kecil. Tao sebenarnya merumuskan versi yang lebih kuat dari lemma keteraturan menggunakan pengaturan ini. Sebagai contoh, dia tidak mengharuskan dan x 2 menjadi variabel independen (meskipun belum ada aplikasi generalisasi ini, sejauh yang saya tahu). x1x2


15

Pada dasarnya ada seluruh kursus yang ditujukan untuk pertanyaan ini:

https://catalyst.uw.edu/workspace/anuprao/15415/86751

Kursus masih berlangsung. Jadi tidak semua catatan tersedia saat menulis ini. Juga, beberapa contoh dari kursus sudah disebutkan.


3
pointer bagus: terlihat seperti kelas yang hebat.
Suresh Venkat

1
Sejauh yang saya tahu, penawaran ini setengah jalan, dengan catatan yang berisi beberapa contoh yang membuat jawaban yang baik untuk pertanyaan saya, dan setengah seminar, yang mencakup contoh-contoh seperti komunikasi batas bawah, ekstraktor, pengulangan paralel, dll, yang membutuhkan lebih dari sekadar teori informasi (di sini tidak ada catatan, hanya tautan ke makalah asli).
Dana Moshkovitz

7

Misalkan kita memiliki poin dalam d 2 dan ingin melakukan pengurangan dimensi. Jika kita ingin jarak berpasangan berubah paling banyak 1 ± ϵ , maka kita dapat mengurangi dimensi kita dari d menjadi O ( log n / ϵ 2 ) . Ini adalah Johnson-Lindenstrauss Lemma . Selama satu dekade batas bawah yang paling dikenal untuk dimensi adalah Ω ( log n / ( ϵ 2 log ( 1 / ϵ ) ) ))n2d1±ϵdO(logn/ϵ2)Ω(logn/(ϵ2log(1/ϵ)))oleh Alon, jadi ada celah ukuran . Baru-baru ini, Jayram dan Woodruff menutup celah ini dengan meningkatkan batas bawah Alon. Bukti mereka nyaris tidak bergantung pada struktur geometris. Apa yang mereka lakukan adalah mereka membuktikan bahwa jika ikatan yang lebih baik dimungkinkan, itu akan melanggar satu kompleksitas komunikasi yang lebih rendah. Dan ikatan ini terbukti menggunakan alat informasi-teoretis.log(1/ϵ)


4
1d

Tampaknya sangat alami dan menyenangkan bahwa hasil yang murni geometris ini dibuktikan oleh orang-orang TCS!
ilyaraz

6

mu[m]x[m]x=utt

O(m1/t)logmuti[t](logm)/tiu sama bitstring itu.

X[m]H[X]=logmX1,,XttH[X]=H[X1]+H[X2|X1]++H[Xt|X1,,Xt1]tlogsssm1/t

t>1



3

Analisis Algoritma Kasus-Rata-Rata Menggunakan Kompleksitas Kolmogorov oleh Jiang, Li, Vitanyi.

'Menganalisis kompleksitas kasus rata-rata algoritma adalah masalah yang sangat praktis tetapi sangat sulit dalam ilmu komputer. Dalam beberapa tahun terakhir kami telah menunjukkan bahwa kompleksitas Kolmogorov adalah alat penting untuk menganalisis kompleksitas kasus rata-rata algoritma. Kami telah mengembangkan metode inkompresibilitas [7]. Dalam makalah ini kami menggunakan beberapa contoh sederhana untuk lebih menunjukkan kekuatan dan kesederhanaan dari metode tersebut. Kami membuktikan batas pada jumlah kasus rata-rata tumpukan (antrian) yang diperlukan untuk menyortir Queueusort atau Stacksort paralel.

Lihat juga misalnya Kompleksitas Kolmogorov dan Masalah Segi Tiga dari Jenis Heilbronn .


3

Kesetaraan pengambilan sampel dan pencarian oleh Scott Aaronson. Di sini ia menunjukkan kesetaraan pengambilan sampel dan pencarian masalah dalam teori kompleksitas sehubungan dengan validitas Tesis Church-Turing Diperpanjang. Teori informasi standar, teori informasi algoritmik, dan kompleksitas Kolmogorov digunakan secara mendasar.

Dia menekankan:
" Mari kita tekankan bahwa kita tidak menggunakan kompleksitas Kolmogorov hanya sebagai kenyamanan teknis, atau sebagai singkatan untuk argumen penghitungan. Sebaliknya, kompleksitas Kolmogorov tampaknya penting bahkan untuk menentukan masalah pencarian .. "


0

Yang satu ini sederhana dan juga perkiraan: berapa banyak kombinasi 10 6 hal dari 10 9 , yang memungkinkan duplikat? Formula yang benar adalah

N = (10 6 + 10 9 )! / (10 6 ! 10 9 !) ~ = 2 11409189.141937481

Tapi bayangkan memberikan instruksi untuk berjalan di sepanjang deretan miliar ember, menjatuhkan satu juta kelereng ke dalam ember di sepanjang jalan. Akan ada ~ 10 9 instruksi "step to the bucket berikutnya" dan 10 6 instruksi "drop a marble". Total informasi adalah

log 2 (N) ~ = -10 6 log 2 (10 6 / (10 6 + 10 9 )) - 10 9 log 2 (10 9 / (10 6 + 10 9 )) ~ ~ 11409200.432742426

yang merupakan cara yang lucu, tapi cukup bagus untuk memperkirakan (log of) hitungan. Saya suka karena itu berfungsi jika saya lupa bagaimana melakukan kombinatorik. Ini sama dengan mengatakan itu

(a + b)! / Sebuah! b! ~ = (a + b) (a + b) / a b b

yang seperti menggunakan perkiraan Stirling, membatalkan, dan melewatkan sesuatu.


2
Ini mungkin lebih mudah dibaca jika Anda melakukan batasan umum daripada angka-angka tertentu. Saya pikir Anda berbicara tentang perkiraan volume bola Hamming berdasarkan entropi.
Sasho Nikolov

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.