Ikhtisar
Jawaban singkatnya adalah bahwa mereka memiliki jumlah maksimum vanishing moments
untuk diberikan support
(yaitu jumlah koefisien filter). Itulah properti "ekstrem" yang membedakan wavelet Daubechies secara umum. Secara longgar, momen yang lebih hilang menunjukkan kompresi yang lebih baik, dan dukungan yang lebih kecil menyiratkan komputasi yang lebih sedikit. Faktanya, pertukaran antara momen menghilang dan ukuran filter sangat penting sehingga mendominasi cara wavelet dinamai. Misalnya, Anda akan sering melihat D4
wavelet yang disebut sebagai D4
atau db2
. The 4
mengacu pada jumlah koefisien, dan2
mengacu pada jumlah momen hilang. Keduanya merujuk pada objek matematika yang sama. Di bawah ini, saya akan menjelaskan lebih lanjut tentang momen apa (dan mengapa kita ingin menghilangkannya), tetapi untuk sekarang, cukup pahami bahwa itu berkaitan dengan seberapa baik kita dapat "melipat" sebagian besar informasi dalam sinyal menjadi lebih kecil. jumlah nilai. Kompresi lossy dicapai dengan menjaga nilai-nilai itu, dan membuang yang lain.
Sekarang, Anda mungkin telah memperhatikan bahwa CDF 9/7
, yang digunakan dalam JPEG 2000
, memiliki dua angka dalam nama, bukan satu. Bahkan, itu juga disebut sebagai bior 4.4
. Itu karena itu bukan wavelet diskrit "standar" sama sekali. Bahkan, secara teknis bahkan tidak menghemat energi dalam sinyal, dan properti itulah yang menjadi alasan utama mengapa orang begitu bersemangat dengan DWT! Angka-angka, 9/7
dan 4.4
, masing-masing masih mengacu pada momen pendukung dan menghilang, tetapi sekarang ada dua set koefisien yang menentukan wavelet. Istilah teknis adalah bahwa bukannya orthogonal
, mereka biorthogonal
. Daripada terlalu mendalam tentang apa artinya secara matematis, saya
JPEG 2000
Diskusi yang jauh lebih rinci tentang keputusan desain seputar gelombang wavelet CDF 9/7 dapat ditemukan dalam makalah berikut:
Usevitch, Bryan E. Tutorial tentang Kompresi Gambar Wavelet Lossy Modern: Yayasan JPEG 2000 .
Saya hanya akan mengulas poin-poin utama di sini.
Cukup sering, wavelet Daubechies ortogonal benar-benar dapat mengakibatkan peningkatan jumlah nilai yang diperlukan untuk mewakili sinyal. Efeknya disebut coefficient expansion
. Jika kita melakukan kompresi lossy yang mungkin atau mungkin tidak masalah (karena kita toh membuang nilai pada akhirnya), tapi itu pasti tampak kontraproduktif dalam konteks kompresi. Salah satu cara untuk menyelesaikan masalah adalah memperlakukan sinyal input sebagai periodik.
Hanya memperlakukan input sebagai hasil berkala dalam diskontinuitas di bagian tepi, yang lebih sulit untuk dikompresi, dan hanya artefak dari transformasi. Misalnya, perhatikan lompatan dari 3 ke 0 dalam ekstensi periodik berikut: . Untuk mengatasi masalah itu, kita dapat menggunakan ekstensi periodik simetris dari sinyal, sebagai berikut: . Menghilangkan lompatan di tepian adalah salah satu alasan Discrete Cosine Transform (DCT) digunakan sebagai pengganti DFT dalam JPEG. Mewakili sebuah sinyal dengan cosinus secara implisit mengasumsikan "pengulangan dari depan ke belakang" dari sinyal input, jadi kami menginginkan wavelet yang memiliki properti simetri yang sama.[ 0 , 1 , 2 , 3 ] → [ . . . , 0 , 1 , 2 , 3 , 3 , 2 , 1[ 0 , 1 , 2 , 3 ] → [ . . 0,0 , 1 , 2 , 3 , 0 , 1 , 2 , 3 , . . . ][ 0 , 1 , 2 , 3 ] → [ . . . , 0 , 1 , 2 , 3 , 3 , 2 , 1 , 0 , 0 , 1 ... ]
Sayangnya, satu-satunya wavelet ortogonal yang memiliki karakteristik yang diperlukan adalah wavelet Haar (atau D2, db1), yang hanya sebagai satu momen menghilang. Ugh. Itu membawa kita ke gelombang biorthogonal, yang sebenarnya merupakan representasi berlebihan, dan karenanya tidak menghemat energi. Alasan mengapa gelombang-gelombang CDF 9/7 digunakan dalam praktik adalah karena gelombang-gelombang itu dirancang untuk mendekati pengawetan energi. Mereka juga telah diuji dengan baik dalam praktik.
Ada cara lain untuk memecahkan berbagai masalah (disebutkan secara singkat di koran), tetapi ini adalah stroke luas dari faktor-faktor yang terlibat.
Momen Hilang
Jadi, apa momennya, dan mengapa kita peduli dengan mereka? Sinyal halus dapat didekati dengan baik oleh polinomial, yaitu fungsi dari bentuk:
a + b x + c x2+ dx3+ . . .
Momen suatu fungsi (yaitu sinyal) adalah ukuran seberapa miripnya dengan kekuatan yang diberikan x. Secara matematis, ini dinyatakan sebagai produk dalam antara fungsi dan kekuatan x. Saat menghilang berarti produk dalam adalah nol, dan oleh karena itu fungsinya tidak "menyerupai" kekuatan x, sebagai berikut (untuk kasus kontinu):
∫xnf( x ) dx = 0
Sekarang masing-masing diskrit, ortogonal wavelet memiliki dua filter FIR yang terkait dengannya, yang digunakan dalam DWT . Salah satunya adalah filter lowpass (atau penskalaan) , dan yang lainnya adalah filter highpass (atau wavelet)ψϕψ. Terminologi itu tampaknya agak berbeda, tetapi itulah yang akan saya gunakan di sini. Pada setiap tahap DWT, filter highpass digunakan untuk "mengupas" lapisan detail, dan filter lowpass menghasilkan versi sinyal yang dihaluskan tanpa detail itu. Jika filter jalan pintas memiliki momen hilang, momen-momen tersebut (yaitu fitur polinomial orde rendah) akan dimasukkan ke dalam sinyal halus yang saling melengkapi, alih-alih sinyal detail. Dalam kasus kompresi lossy, semoga sinyal detail tidak memiliki banyak informasi di dalamnya, dan oleh karena itu kita dapat membuang sebagian besar darinya.
Berikut adalah contoh sederhana menggunakan wavelet Haar (D2). Biasanya ada faktor penskalaan terlibat, tapi saya mengabaikannya di sini untuk mengilustrasikan konsep tersebut. Kedua filter tersebut adalah sebagai berikut:
ϕ=[1,1]1 / 2-√
ϕ = [ 1 , 1 ]ψ = [ 1 , - 1 ]
Filter highpass menghilang untuk momen ke-0, yaitu , oleh karena itu memiliki satu momen hilang. Untuk melihatnya, perhatikan sinyal konstan ini: . Sekarang secara intuitif, seharusnya jelas bahwa tidak ada banyak informasi di sana (atau dalam sinyal konstan). Kita bisa menggambarkan hal yang sama dengan mengatakan "empat berpasangan". DWT memberi kita cara untuk menggambarkan intuisi itu secara eksplisit. Inilah yang terjadi selama satu pass DWT menggunakan wavelet Haar:[ 2 , 2 , 2 , 2 ]x0= 1[ 2 , 2 , 2 , 2 ]
[ 2 , 2 , 2 , 2 ] →ϕψ{ [ 2 + 2 , 2 + 2 ] = [ 4 , 4 ][ 2 - 2 , 2 - 2 ] = [ 0 , 0 ]
Dan apa yang terjadi pada pass kedua, yang beroperasi hanya pada sinyal yang dihaluskan:
[ 4 , 4 ] →ϕψ{ [ 4 + 4 ] = [ 8 ][ 4 - 4 ] = [ 0 ]
Perhatikan bagaimana sinyal konstan sama sekali tidak terlihat oleh lintasan detail (yang semuanya keluar menjadi 0). Juga perhatikan bagaimana empat nilai telah direduksi menjadi nilai tunggal . Sekarang jika kita ingin mengirimkan sinyal asli, kita bisa mengirim , dan DWT Inverse dapat merekonstruksi sinyal asli dengan mengasumsikan bahwa semua koefisien detail adalah nol. Wavelet dengan momen menghilang yang lebih tinggi memungkinkan hasil yang sama dengan sinyal yang diperkirakan dengan baik oleh garis, parabola, kubik, dll8 8288
Bacaan lebih lanjut
Saya membahas banyak detail untuk membuat perawatan di atas dapat diakses. Makalah berikut memiliki analisis yang lebih dalam:
M. Unser, dan T. Blu, properti matematika dari filter wavelet JPEG2000 , IEEE Trans. Image Proc., Vol. 12, tidak. 9, September 2003, hal.1080-1090.
Catatan kaki
Makalah di atas tampaknya menunjukkan bahwa wavelet JPEG2000 disebut Daubechies 9/7, dan berbeda dari wavelet CDF 9/7.
Kami telah mendapatkan bentuk persis dari filter penskalaan JPEG2000 Daubechies 9/7 ... Filter ini dihasilkan dari faktorisasi polinomial yang sama dengan [10]. Perbedaan utama adalah bahwa filter 9/7 simetris. Selain itu, tidak seperti spline biorthogonal Cohen-Daubechies-Feauveau [11], bagian polinomial yang tidak beraturan telah dibagi antara kedua belah pihak, dan serata mungkin.Daubechies8
[11] A. Cohen, I. Daubechies, dan JC Feauveau, "Basis biorthogonal dari wavelet yang didukung secara kompak," Comm. Appl Murni Matematika, vol. 45, tidak. 5, hlm. 485–560, 1992.
Draf standar JPEG2000 ( tautan pdf ) yang saya telusuri juga menyebut filter resmi Daubechies 9/7. Ini referensi makalah ini:
M. Antonini, M. Barlaud, P. Mathieu, dan I. Daubechies, “Pengodean gambar menggunakan transformasi wavelet,” IEEE Trans. Gambar Proc. 1, hlm. 205-220, April 1992.
Saya belum membaca salah satu dari sumber-sumber itu, jadi saya tidak bisa mengatakan dengan pasti mengapa Wikipedia menyebut JPEG2000 wavelet CDF 9/7. Sepertinya mungkin ada perbedaan antara keduanya, tetapi orang-orang tetap memanggil resmi CDEG 9/7 JPEG2000 (karena didasarkan pada fondasi yang sama?). Terlepas dari namanya, kertas oleh Usevitch menjelaskan yang digunakan dalam standar.