Ketika berhadapan dengan raster dengan resolusi berbeda-beda, haruskah seseorang membuat ulang resolusi tertinggi atau terendah?


16

Saya mencari rekomendasi tentang praktik terbaik untuk menangani lapisan data raster dengan resolusi dan proyeksi yang berbeda. Saran yang saya berikan adalah untuk selalu melakukan resample ke layer dengan resolusi terendah sebelum melakukan analisis apa pun, tetapi ini sepertinya membuang-buang presisi bagi saya dan saya tidak pernah diberi penjelasan yang solid mengapa itu harus dilakukan.

Kapan masuk akal untuk mencocokkan ulang agar sesuai dengan kisi resolusi yang lebih tinggi dan apa implikasinya dibandingkan dengan mengamplas ke resolusi yang lebih rendah?

Saya menyadari bahwa ini sangat tergantung pada situasi. Saya kebanyakan mencari pedoman umum, tapi inilah skenario khusus saya untuk referensi:

Skenario: Saya sedang mencari untuk membangun model regresi spasial yang memprediksi penggunaan lahan berdasarkan berbagai lapisan lingkungan dan sosial ekonomi. Peta penggunaan lahan saya berasal dari Landsat dan karenanya memiliki resolusi 30m. Contoh lapisan penjelas termasuk DEM SRTM (3 arc-detik, ~ 90m) dan lapisan iklim Bioclim (30 arc-detik, ~ 1km).


1
Bisakah Anda memberikan informasi lebih lanjut tentang model regresi dan metode pelaksanaannya? +1 untuk pertanyaan menarik yang dibangun dengan baik!
Aaron

Saya membandingkan tutupan hutan pada dua titik waktu dan menggunakan model regresi logistik dengan probabilitas (biner) deforestasi sebagai tanggapan saya. Saya akan menerapkannya di R.
Matt SM

Jawaban:


17

Sebenarnya ini tidak semua tergantung pada situasi dan semua tentang kesalahan statistik.

Setiap kali Anda melakukan resample ke resolusi yang lebih tinggi, Anda memperkenalkan akurasi yang salah. Pertimbangkan satu set data yang diukur dalam kaki hanya pada bilangan bulat. Setiap titik yang diberikan mungkin +/- 0,5 kaki dari lokasi sebenarnya. Jika Anda menguji ulang ke persepuluh terdekat, Anda sekarang mengatakan bahwa angka yang diberikan tidak lebih dari +/- 0,1 dari lokasi sebenarnya. Namun Anda tahu pengukuran asli Anda tidak seakurat itu, dan Anda sekarang beroperasi dalam margin of error. Namun jika Anda memilih sebaliknya dan melakukan resample ke resolusi yang lebih rendah, Anda tahu bahwa nilai poin yang diberikan pasti akurat karena terkandung dalam margin of error sampel yang lebih besar.

Di luar matematika statistik, tempat pertama yang muncul dalam pikiran adalah dalam survei tanah. Survei yang lebih lama hanya menentukan bantalan ke setengah menit terdekat dan jarak ke sepersepuluh kaki. Memplot garis batas dengan pengukuran-pengukuran ini seringkali dapat menghasilkan kesalahan tutupan (titik awal dan titik akhir harus sama tetapi tidak) diukur dengan kaki. Survei modern pergi ke setidaknya satu detik terdekat dan satu kaki. Nilai yang diturunkan (seperti area banyak) dapat secara signifikan dipengaruhi oleh perbedaan dalam presisi. Nilai yang diturunkan itu sendiri juga dapat diberikan sebagai terlalu tepat.

Dalam kasus analisis Anda, jika Anda melakukan resample ke resolusi yang lebih tinggi, hasil Anda akan menyiratkan akurasi yang jauh lebih besar daripada data yang menjadi dasarnya. Pertimbangkan SRTM Anda pada jarak 90m. Dengan metode apa pun mereka mengukur ketinggian (rata-rata / pengembalian rata-rata), unit terkecil (piksel) yang dapat dibedakan dari tetangganya adalah 90m. Jika Anda membuat ulang itu menjadi 30m, baik:

  • Anda mengasumsikan kesembilan piksel yang dihasilkan adalah ketinggian yang sama padahal sebenarnya hanya satu - tengah, atau kiri atas - (atau tidak ada!) adalah
  • Anda menyisipkan antar piksel, membuat nilai turunan yang tidak ada sebelumnya

Dengan demikian dalam kedua kasus Anda memperkenalkan akurasi palsu karena subsampel baru Anda tidak benar-benar diukur.

Pertanyaan terkait: Praktik apa yang tersedia untuk memodelkan kesesuaian lahan?


Itu tentu berlaku untuk data titik. Tapi saya bertanya-tanya apakah itu berbeda untuk data raster yang rata-rata kuantitas spasial yang bervariasi di mana ada ketepatan lokasi dan ketepatan jumlah yang diukur. Juga, jumlah yang berbeda memiliki tingkat variasi spasial yang berbeda. Sebagai contoh, resampling data ketinggian ke resolusi yang lebih tinggi harus menimbulkan lebih banyak kesalahan di daerah pegunungan daripada padang rumput.
Matt SM

@ MRSM Ini benar dari semua data spasial, dan diperparah oleh kesalahan statistik dari kuantitas yang diukur. Pertimbangkan SRTM Anda pada jarak 90m. Dengan metode apa pun mereka mengukur ketinggian (rata-rata / pengembalian rata-rata), unit terkecil (piksel) yang dapat dibedakan dari tetangganya adalah 90m. Jika Anda mengubah ukuran menjadi 30m, Anda sekarang mengatakan semua 9 piksel yang dihasilkan memiliki ketinggian yang sama ketika sebenarnya mungkin hanya satu (atau tidak ada!) Adalah - tengah, atau kiri atas. Atau Anda menyisipkan antar piksel, membuat nilai yang tidak ada sebelumnya, sehingga akurasi salah. Dan ya, rentang nilai memainkan potensi kesalahan.
Chris W

Hanya sebagai catatan tambahan dimungkinkan untuk interpolasi spesifik fitur dalam kasus khusus di mana polanya jelas terbatas - satu, fitur non-geografis, yang terlintas dalam pikiran adalah merekonstruksi informasi plat nomor dari foto yang terlalu rendah resolusi untuk dibaca. Tetapi Anda harus tahu apa yang Anda lihat. Saya ingat beberapa kasus di mana rekonstruksi plat nomor gagal karena plat yang dimaksud adalah tulisan non-Eropa seperti bahasa Arab.
Steve Barnes

Bagaimana dengan raster dengan resolusi berbasis busur, bukankah mereka memiliki sel-sel jaringan yang bisa dari berbagai bidang / aspek-rasio di daerah yang berbeda?
CMCDragonkai

@ CMCDragonkai Saya tidak yakin bagaimana mengatasinya karena Anda masuk ke representasi data vs format dan mengoordinasikan sistem / proyeksi. Ya, area geografis dalam raster tidak harus sama seragamnya dengan piksel persegi (atau rasio aspek lainnya). Banyak spesifikasi data sat akan memberi tahu Anda hal ini (piksel adalah x pada nadir dan y pada tepi petak). Tapi masalah resampling masih berlaku - jika itu hanya menambah masalah. (Dan maaf atas keterlambatan, saya belum pernah berada di SE dalam beberapa waktu.)
Chris W
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.