Balasan ini menjelaskan metode objektif untuk mengukur perbedaan sewenang-wenang antara dua set data spasial. Perbedaan tersebut dapat mencakup pergeseran posisi, perubahan bentuk, dan fitur yang ada di satu dataset tetapi tidak di yang lain. Jawaban ini tidak menyediakan sarana apa pun untuk menentukan mana yang "lebih baik," karena itu tergantung pada lebih dari sekadar data dan terutama tergantung pada apa data akan digunakan.
Latar Belakang
Fondasi yang baik untuk sejumlah besar pengukuran semacam itu bergantung pada transformasi jarak Euclidean dari setiap dataset. Ini melihat setiap dataset sebagai mewakili kumpulan poin dalam pesawat. Sebut saja koleksi B ini untuk fitur biru dan R untuk fitur merah.
Untuk setiap titik x di pesawat, jarak Euclidean transformasi dari set point A menghitung terbesar batas bawah dari jarak antara x dan A . Kita mungkin berpikir ini mengubah sebagai menciptakan "permukaan" yang tingginya di x sama dengan jarak terpendek dari x ke A . Dengan demikian permukaan ini memiliki lembah di semua titik A , di mana puncaknya adalah nol, dan naik pada 1: 1 kemiringan jauh dari A . Jelaslah bahwa transformasi jarak pada gilirannya menentukan A (atau secara teknis penutupan metriknya , yang untuk dataset GIS sama dengan A) sebagai himpunan semua titik pada ketinggian nol. Dengan demikian transformasi jarak sepenuhnya menangkap semua informasi spasial A yang dapat disajikan oleh GIS.
Gambar ini menunjukkan jarak transformasi B (di sebelah kiri) dan R (di sebelah kanan) dalam relief semu.
Membandingkan dua lembar data
Untuk membandingkan B dan R , overlay masing-masing dengan transformasi jarak yang lain:
Nilai jarak ditampilkan sebagai warna lulus dari blues (dekat 0) hingga merah.
Peta kiri, misalnya, menunjukkan titik-titik B dan warna mereka sesuai dengan jarak mereka dari R . Peran B dan R diaktifkan di peta yang benar.
Ini sudah membantu mata dalam membuat perbandingan: setiap peta menunjukkan titik-titik dari satu dataset dan, dengan penggunaan warna, menekankan titik-titik yang jauh dari titik di dataset lainnya. Perhatikan bahwa kedua peta diperlukan untuk perbandingan, karena masing-masing menunjukkan titik bukan pada yang lain.
Pada peta terperinci, warnanya bisa sulit dilihat, jadi kami mungkin memilih untuk mengaburkannya sedikit untuk presentasi atau evaluasi visual:
NB: Warna-warna tidak sebanding antara dua peta: dalam setiap peta mereka diskalakan untuk menunjukkan kisaran penuh jarak di peta itu.
Analisis statistik perbedaan
Keindahan dari pendekatan ini terletak pada apa yang dapat dilakukan dalam pasca-pemrosesan. Menggunakan raster untuk mewakili transformasi jarak dan overlaynya, kita dapat dengan mudah memperoleh statistik - lokal dan global - untuk mengukur perbedaan. Misalnya, kita dapat fokus pada semua jarak yang lebih besar dari beberapa ambang batas kecil mengeksplorasi distribusi frekuensi mereka:
Dalam histogram ini bilah biru untuk fitur biru, bilah merah untuk fitur merah. (Perhatikan skala logaritmik pada sumbu horizontal.) Histogram ini menunjukkan data overlay asli, bukan data turunan kabur. Ini telah memilih hanya jarak yang lebih besar dari tiga piksel dalam gambar asli.
Histogram-histogram ini menunjukkan bahwa fitur biru jauh lebih mungkin terletak jauh dari fitur merah daripada sebaliknya : bilah biru lebih tinggi daripada merah dan memanjang ke jarak yang lebih jauh (di sebelah kanan). Seluruh gudang statistik deskriptif sekarang tersedia untuk mengukur perbedaan antara dua set data. Statistik ini dapat diterapkan ke seluruh wilayah yang diminati atau "di-windowed" untuk mengeksplorasi bagaimana dua set data berbeda berdasarkan lokasi.
Penerapan
Sebagian besar GIS raster menyediakan transformasi jarak Euclidean (seperti EuclideanDistance di ArcGIS dan r.grow.distance dalam GRASS), dan semua mendukung overlay (penutup) sederhana yang diperlukan untuk melakukan analisis ini. Kabur, jika diinginkan, dapat dilakukan dengan rukun tetangga atau konvolusi kernel (yang mencakup "Gaussian blur" yang tersedia di semua perangkat lunak pengolah gambar). Namun, sebagian besar GIS tidak menyediakan dukungan yang memadai untuk analisis statistik penuh data raster, tetapi mereka pandai mengekspor data tersebut dalam format yang dapat dibaca oleh perangkat lunak statistik dan matematika seperti R
atau Mathematica (yang menjadikan semua gambar di sini).