Inilah usaha saya.
Latar Belakang
Pertimbangkan dua kasus berikut.
- Anda adalah mata pribadi di sebuah pesta. Tiba-tiba, Anda melihat salah satu klien lama Anda berbicara dengan seseorang, dan Anda dapat mendengar beberapa kata tetapi tidak cukup, karena Anda juga mendengar orang lain di sebelahnya, berpartisipasi dalam diskusi yang tidak terkait tentang olahraga. Anda tidak ingin mendekat - dia akan melihat Anda. Anda memutuskan untuk mengambil ponsel pasangan Anda (yang sibuk meyakinkan bartender bir non-alkohol hebat) dan menanamnya sekitar 10 meter di sebelah Anda. Telepon sedang merekam, dan telepon juga merekam pembicaraan klien lama dan juga olahragawan yang mengganggu. Anda mengambil telepon Anda sendiri dan mulai merekam juga, dari tempat Anda berdiri. Setelah sekitar 15 menit Anda pulang dengan dua rekaman: satu dari posisi Anda, dan yang lainnya dari jarak sekitar 10 meter. Kedua rekaman berisi klien lama Anda dan Tn. Sporty,
- Anda mengambil foto seekor anjing Labrador Retriever yang lucu yang Anda lihat di luar jendela. Anda memeriksa gambar, dan sayangnya Anda melihat pantulan dari jendela yang ada di antara Anda dan anjing. Anda tidak dapat membuka jendelanya (itu salah satunya, ya) dan Anda tidak bisa keluar karena takut dia akan lari. Jadi Anda mengambil (karena alasan yang tidak jelas) gambar lain, dari posisi yang sedikit berbeda. Anda masih melihat pantulan dan anjing, tetapi mereka berada di posisi yang berbeda sekarang, karena Anda mengambil gambar dari tempat yang berbeda. Perhatikan juga bahwa posisi berubah secara seragam untuk setiap piksel dalam gambar, karena jendelanya datar dan tidak cekung / cembung.
Pertanyaannya adalah, dalam kedua kasus, bagaimana mengembalikan percakapan (dalam 1.) atau gambar anjing (dalam 2.), mengingat dua gambar yang berisi dua "sumber" yang sama tetapi dengan kontribusi relatif sedikit berbeda dari masing-masing . Tentunya cucu saya yang berpendidikan bisa memahami ini!
Solusi intuitif
Bagaimana kita, setidaknya secara prinsip, bisa mendapatkan kembali gambar anjing dari campuran? Setiap piksel berisi nilai yang merupakan jumlah dua nilai! Nah, jika setiap piksel diberikan tanpa piksel lain, intuisi kita akan benar - kita tidak akan bisa menebak kontribusi relatif yang tepat dari masing-masing piksel.
Namun, kami diberi satu set piksel (atau titik waktu dalam kasus rekaman), yang kami tahu memiliki hubungan yang sama. Misalnya, jika pada gambar pertama, anjing selalu dua kali lebih kuat dari pantulan, dan pada gambar kedua, itu justru sebaliknya, maka kita mungkin bisa mendapatkan kontribusi yang benar. Dan kemudian, kita dapat menemukan cara yang benar untuk mengurangi dua gambar yang ada sehingga refleksi dibatalkan! [Secara matematis, ini berarti menemukan matriks campuran terbalik.]
Menyelam menjadi detail
Y1=a11S1+a12S2Y2=a21S1+a22S2
S1Y1,Y2S1=b11Y1+b12Y2(b11,b12)S2( b21, b22)
Tetapi bagaimana Anda bisa menemukannya untuk sinyal umum? mereka mungkin terlihat mirip, memiliki statistik yang sama, dll. Jadi anggaplah mereka independen. Itu masuk akal jika Anda memiliki sinyal yang mengganggu, seperti noise, atau jika dua sinyal adalah gambar, sinyal yang mengganggu mungkin merupakan cerminan dari sesuatu yang lain (dan Anda mengambil dua gambar dari sudut yang berbeda).
Y1Y2S1, S2X1, X2
X1, X2S1, S2X1, X2bsaya j{ asaya j}{ bsaya j}Ssaya
{ bsaya j}X1,X2
Jadi pertama-tama pertimbangkan ini: jika kita menjumlahkan beberapa sinyal independen, non-Gaussian, kami membuat jumlah "lebih banyak Gaussian" daripada komponen. Mengapa? karena teorema batas pusat, dan Anda juga dapat berpikir tentang kepadatan jumlah dua indep. variabel, yang merupakan konvolusi kepadatan. Jika kita menjumlahkan beberapa indep. Variabel Bernoulli, distribusi empiris akan lebih menyerupai bentuk Gaussian. Apakah ini akan menjadi Gaussian sejati? mungkin tidak (tidak bermaksud kata-kata), tetapi kita dapat mengukur Gaussianity dari suatu sinyal dengan jumlah yang menyerupai distribusi Gaussian. Misalnya, kita dapat mengukur kelebihan kurtosisnya. Jika benar-benar tinggi, mungkin Gaussian kurang dari satu dengan varian yang sama tetapi dengan kurtosis berlebih mendekati nol.
{bij}X1,X2{bij}
Tentu saja, ini menambah asumsi lain - dua sinyal harus non-Gaussian untuk memulai.