Data terdiri dari spektra optik (intensitas cahaya terhadap frekuensi) yang direkam pada waktu yang bervariasi. Poin diperoleh pada grid reguler dalam x (waktu), y (frekuensi). Untuk menganalisis evolusi waktu pada frekuensi tertentu (kenaikan cepat, diikuti oleh peluruhan eksponensial), saya ingin menghapus beberapa derau yang ada dalam data. Kebisingan ini, untuk frekuensi tetap, mungkin dapat dimodelkan secara acak dengan distribusi gaussian. Namun, pada waktu yang tetap, data menunjukkan jenis kebisingan yang berbeda, dengan lonjakan palsu besar dan osilasi cepat (+ derau gaussian acak). Sejauh yang saya bisa bayangkan kebisingan di sepanjang dua sumbu harus tidak berkorelasi karena memiliki asal fisik yang berbeda.
Apa prosedur yang wajar untuk memperlancar data? Tujuannya bukan untuk mendistorsi data, tetapi menghapus artefak berisik yang "jelas". (dan dapatkah over-smoothing disetel / dikuantifikasi?) Saya tidak tahu apakah merapikan satu arah secara terpisah dari yang lain masuk akal, atau apakah lebih baik halus dalam 2D.
Saya sudah membaca hal-hal tentang estimasi kepadatan kernel 2D, interpolasi polinomial / spline 2D, dll. Tapi saya tidak akrab dengan jargon atau teori statistik yang mendasarinya.
Saya menggunakan R, yang saya lihat banyak paket yang tampaknya terkait (MASS (kde2), bidang (smooth.2d), dll.) Tetapi saya tidak dapat menemukan banyak saran tentang teknik mana yang berlaku di sini.
Saya senang belajar lebih banyak, jika Anda memiliki referensi khusus untuk menunjukkan saya (saya mendengar MASS akan menjadi buku yang bagus, tapi mungkin terlalu teknis untuk non-ahli statistik).
Sunting: Berikut adalah perwakilan spektrogram boneka dari data, dengan irisan sepanjang dimensi waktu dan panjang gelombang.
Tujuan praktis di sini adalah untuk mengevaluasi tingkat peluruhan eksponensial dalam waktu untuk setiap panjang gelombang (atau nampan, jika terlalu berisik).