Konsep sentral di sini adalah kompleksitas Kolmogorov , dan lebih khusus kompresibilitas . Untuk mendapatkan perasaan kompresibilitas yang intuitif, pertimbangkan dua string dan B ∈ B ∗ , di mana B = { 0 , 1 } . MembiarkanA∈B∗B∈B∗B={0,1}
1010 1010 1010 , danA=1010 1010 1010 1010
0110 0111 1001 .B=1011 0110 0111 1001
Perhatikan bahwa . Bagaimana kita dapat mengukur berapa banyak informasi yang dimiliki A atau B ? Jika kita berpikir tentang teori informasi klasik, secara umum, mentransmisikan string dengan panjang n membutuhkan n bit rata-rata. Namun kita tidak bisa mengatakan berapa banyak bit kita perlu mengirimkan tertentu string dengan panjang n .|A|=|B|=16ABnnn
Mengapa konten informasi dari string acak tidak nol?
Pada melihat lebih dekat, kita dapat melihat bahwa sebenarnya . Namun, jauh lebih sulit untuk mengatakan jika B memiliki setiap pola yang jelas dalam struktur, setidaknya itu tampaknya dan terasa lebih acak dari A . Karena kita dapat menemukan pola dalam A , kita dapat dengan mudah kompres A dan mewakilinya dengan kurang dari 16 bit. Demikian juga, karena tidak mudah untuk mendeteksi pola dalam B , kita tidak bisa kompres sebagai banyak. Oleh karena itu kita dapat mengatakan bahwa B memiliki informasi lebih dari A . Selain itu, string acak dengan panjang nA=108BAAA16BBAnmemiliki informasi maksimal karena tidak ada cara kita dapat memampatkannya, dan karenanya mewakili dengan kurang dari bit.n
Lalu apa informasi yang berguna?
Untuk informasi yang berguna , ya, ada definisi menggunakan Turing mesin . Informasi yang berguna dalam x ∈ B ∗ adalahTx∈B∗
minT { l ( T ) + C( x | T) : T∈ { T0, T1, . . . } } ,
di mana menunjukkan panjang dari encoding membatasi diri untuk Turing mesin T . Notasi biasanya sehingga C ( x ) menunjukkan kompleksitas Kolmogorov dari x dan C ( x | y ) kompleksitas Kolmogorov bersyarat x diberikan y .l ( T)TC( x )xC( x | y)xy
Berikut mewujudkan jumlah informasi yang berguna yang terkandung dalam x . Apa yang kita bisa meminta adalah yang seperti T untuk memilih di antara mereka yang memenuhi persyaratan. Masalahnya adalah untuk memisahkan program terpendek x * menjadi bagian-bagian x * = p q st p merupakan yang tepat T . Ini sebenarnya adalah gagasan yang menelurkan panjang deskripsi minimum (MDL) .TxTx∗x∗= P qhalT