Cara baru untuk mengisi nilai yang hilang dalam raster


8

Saya mencari cara kuat untuk mengisi nilai yang hilang di beberapa raster. Mereka semua memiliki satu layer. Nilai yang hilang terdiri dari satu piksel hingga tambalan berukuran sedang. Raster berukuran sekitar 1000 x 1000 piksel dan tambalan terbesar adalah 20x20 piksel.

Saya tergoda untuk menggunakan aregImpute dalam paket Hmisc R. Adakah yang menggunakannya untuk tujuan ini?

pendekatan ini terlihat sangat keren tapi saya pikir itu hanya dimaksudkan untuk menghasilkan koreksi yang estetis.

Penjelasan terperinci tentang ini:

Semua raster (saya memiliki total 36) berbagi tingkat yang sama, mereka tumpang tindih dan selaras. Setiap raster adalah variabel yang berbeda, saya mengumpulkan variabel dari berbagai sumber (penginderaan jauh, topografi dan klimatologis). Raster asli datang dalam berbagai resolusi. Yang terkecil 30 m. Dari sana mereka mendapatkan setinggi 1 km. Saya resampled semuanya menggunakan konvolusi kubik (semua variabel adalah kontinu) hingga 1 km. Saya memiliki 1 km raster di mana saya memiliki data variabel yang menarik untuk beberapa titik sampel. Jadi saya melatih model menggunakan titik-titik dan raster lain sebagai kovariat untuk dapat menghasilkan raster penuh dari variabel itu. Sayangnya sebagian besar rovarian kovariat memiliki beberapa nilai yang hilang di dalamnya, sebenarnya tidak banyak tetapi saya ingin menghilangkan masalahnya sama sekali.

Terima kasih.

ps Saya lebih suka menggunakan R untuk ini.


Apa alasan hilangnya itu dan mengapa Anda mengisi nilainya? (Kedua hal ini penting dalam pemilihan solusi yang tepat.) Apa sebenarnya yang Anda maksud dengan "kuat"? (Ini memiliki arti statistik teknis tetapi belum jelas bagaimana itu akan berlaku di sini.)
whuber

Saya menggunakan layer sebagai kovariat untuk model prediksi. Model yang saya gunakan tidak menangani nilai yang hilang, jadi itu tidak menghitung piksel dengan nilai yang hilang di salah satu raster, meninggalkan lubang di "lapisan prediksi" saya. Mungkin kata robust tidak digunakan dengan baik, saya minta maaf. Apa yang akan saya cari adalah bahwa imputasi mempertahankan hubungan mendasar antara kovariat dan variabel objektif saya. Saya tidak yakin bagaimana menyebutnya, asumsi berlipat ganda?
JEquihua

Tergantung pada variabelnya, kesalahan tersebut disebabkan oleh kesalahan sensor atau kesalahan pengukuran yang digantikan oleh nilai yang hilang.
JEquihua

Apakah raster Anda tumpang tindih atau tidak? Jika mereka tidak tumpang tindih, atau jika jumlah tumpang tindih yang khas hanya dua atau tiga raster pada satu titik, maka akan sulit untuk mendapatkan banyak nilai dari aregImpute. Jika tidak, itu adalah pendekatan yang menjanjikan yang bahkan akan lebih menarik jika Anda memasukkan istilah korelasi spasial dalam model.
whuber

1
Data yang hilang karena masalah penginderaan selalu berkorelasi spasial. Saya menduga bahwa metode apa pun yang masuk akal untuk korelasi ini, betapapun sederhananya, akan berkinerja lebih baik daripada metode tercanggih yang mengabaikan korelasi itu. Resampling bisa menjadi masalah, tetapi tidak jelas apa yang telah Anda lakukan. Penjelasan lebih rinci dalam pertanyaan Anda akan diterima. (Prinsip umum yang baik adalah melakukan analisis statistik Anda dengan data asli dan bukan data yang di-resampled jika Anda bisa, untuk menghindari artefak dari resampling.)
whuber

Jawaban:


5

Saya adalah penulis paket R gapfill, yang merupakan alat fleksibel untuk memprediksi nilai yang hilang dalam set data penginderaan jauh spatio-temporal. https://CRAN.R-project.org/package=gapfill Ini bisa membantu dalam kasus Anda.

Untuk tinjauan umum metode yang dipublikasikan untuk memprediksi nilai yang hilang dalam set data penginderaan jauh lihat Tabel 1 dari publikasi terkait https://doi.org/10.1109/TGRS.2017.2785240 .


1
Paket yang menarik. Kerja bagus!
aldo_tapia
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.