Pertanyaan yang diberi tag «data-compression»



6
Apakah algoritma kompresi lossless mengurangi entropi?
Menurut Wikipedia : Entropi Shannon mengukur informasi yang terkandung dalam pesan sebagai lawan bagian pesan yang ditentukan (atau dapat diprediksi). Contoh yang terakhir termasuk redundansi dalam struktur bahasa atau sifat statistik yang berkaitan dengan frekuensi kemunculan pasangan huruf atau kata, kembar tiga dll. Jadi entropi adalah ukuran dari jumlah informasi …


6
Kompresi data biner sederhana yang efisien
Saya memiliki file yang berisi nomor biner yang dipesan dari hingga :0002n−12n−12^n - 1 0000000000 0000000001 0000000010 0000000011 0000000100 ... 1111111111 7z tidak mengkompres file ini dengan sangat efisien (untuk n = 20, 22 MB dikompresi hingga 300 kB). Apakah ada algoritma yang dapat mengenali struktur data yang sangat sederhana …


5
Kompresi data menggunakan bilangan prima
Saya baru-baru ini menemukan artikel menarik berikut yang mengklaim secara efisien mengompresi set data acak dengan selalu lebih dari 50%, terlepas dari jenis dan format data. Pada dasarnya ia menggunakan bilangan prima untuk secara unik membangun representasi potongan data 4-byte yang mudah untuk didekompresi mengingat bahwa setiap angka adalah produk …

3
Mendekati kompleksitas Kolmogorov
Saya telah mempelajari sesuatu tentang Kompleksitas Kolmogorov , membaca beberapa artikel dan buku dari Vitanyi dan Li dan menggunakan konsep Normalized Compression Distance untuk memverifikasi stilometri penulis (mengidentifikasi bagaimana setiap penulis menulis beberapa teks dan dokumen kelompok berdasarkan kesamaan mereka). Dalam hal itu, kompresor data digunakan untuk memperkirakan kompleksitas Kolmogorov, …


1
Kompresi nama domain
Saya ingin tahu bagaimana seseorang dapat dengan sangat kompak mengompres domain dari nama host IDN yang sewenang-wenang (seperti yang didefinisikan oleh RFC5890 ) dan menduga ini bisa menjadi tantangan yang menarik. Host Unicode atau nama domain (U-label) terdiri dari serangkaian karakter Unicode, biasanya dibatasi pada satu bahasa tergantung pada domain …


7
Dapat random suitless
Saya memiliki data nyata yang saya gunakan untuk permainan kartu simulasi. Saya hanya tertarik pada jajaran kartu, bukan jas. Namun itu adalah dek kartu standar sehingga hanya ada dari setiap peringkat yang mungkin di dek. Dek dikocok dengan baik untuk masing-masing tangan, dan kemudian saya output seluruh dek ke file. …

4
Bisakah data dikompres dengan ukuran lebih kecil dari batas kompresi data Shannon?
Saya sedang membaca tentang algoritma kompresi data dan batas teoritis untuk kompresi data. Baru-baru ini saya menemukan metode kompresi yang disebut "Combinatorial Entropy Encoding", ide utama dari metode ini adalah untuk menyandikan file sebagai karakter yang disajikan dalam file, frekuensi mereka dan indeks permutasi karakter ini diwakili oleh file. Dokumen-dokumen …

1
Mengapa rasio kompresi menggunakan bzip2 untuk urutan "a" begitu gelisah?
library(ggplot2) compress <- function(str) { length(memCompress(paste(rep("a", str), collapse=""), type="bzip2")) / nchar(paste(rep("a", str), collapse="")) } cr <- data.frame(i = 1:10000, r = sapply(1:10000, compress)) ggplot(cr[cr$i>=5000 & cr$i<=10000,], aes(x=i, y=r)) + geom_line() Rasio kompresi dimulai pada 37 untuk "a" dan mencapai titik impas pada 39 "a" (rasio kompresi = 1). Grafik dimulai …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.