Jawaban:
Seperti biasa, itu tergantung pada tujuan Anda dan sifat data. Untuk data yang sepenuhnya dipetakan , alat yang ampuh adalah fungsi L Ripley, kerabat dekat fungsi K Ripley . Banyak perangkat lunak dapat menghitung ini. ArcGIS mungkin melakukannya sekarang; Saya belum memeriksa. CrimeStat melakukannya. Begitu GeoDa dan R . Contoh penggunaannya, dengan peta terkait, muncul di
Sinton, DS dan W. Huber. Memetakan polka dan warisan etnisnya di Amerika Serikat. Jurnal Geografi Vol. 106: 41-47. 2007
Berikut adalah tangkapan layar CrimeStat versi "fungsi L" dari Ripley's K:
Kurva biru mendokumentasikan distribusi titik yang sangat tidak acak, karena tidak terletak di antara pita merah dan hijau di sekitar nol, yang merupakan tempat jejak biru untuk fungsi-L dari distribusi acak berada.
Untuk data sampel, banyak tergantung pada sifat pengambilan sampel. Sumber yang bagus untuk ini, dapat diakses oleh mereka yang memiliki latar belakang matematika dan statistik yang terbatas (tetapi tidak sepenuhnya absen), adalah buku teks Steven Thompson tentang Sampling .
Pada umumnya, sebagian besar perbandingan statistik dapat diilustrasikan secara grafis dan semua perbandingan grafis sesuai dengan atau menyarankan mitra statistik. Karenanya setiap ide yang Anda dapatkan dari literatur statistik kemungkinan akan menyarankan cara yang berguna untuk memetakan atau membandingkan secara grafis kedua set data.
Catatan: berikut ini diedit mengikuti komentar whuber
Anda mungkin ingin mengadopsi pendekatan Monte Carlo. Ini contoh sederhana. Asumsikan Anda ingin menentukan apakah distribusi peristiwa kriminal A secara statistik mirip dengan B, Anda dapat membandingkan statistik antara peristiwa A dan B dengan distribusi empiris dari ukuran tersebut untuk 'penanda' yang dipindahkan secara acak.
Misalnya, diberi distribusi A (putih) dan B (biru),
Anda secara acak menetapkan ulang label A dan B untuk SEMUA poin dalam dataset gabungan. Ini adalah contoh simulasi tunggal:
Anda mengulangi ini berkali-kali (katakan 999 kali), dan untuk setiap simulasi, Anda menghitung statistik (rata-rata statistik tetangga terdekat dalam contoh ini) menggunakan titik berlabel acak. Cuplikan kode yang mengikuti berada di R (membutuhkan penggunaan perpustakaan spatstat ).
nn.sim = vector()
P.r = P
for(i in 1:999){
marks(P.r) = sample(P$marks) # Reassign labels at random, point locations don't change
nn.sim[i] = mean(nncross(split(P.r)$A,split(P.r)$B)$dist)
}
Anda kemudian dapat membandingkan hasilnya secara grafis (garis vertikal merah adalah statistik asli),
hist(nn.sim,breaks=30)
abline(v=mean(nncross(split(P)$A,split(P)$B)$dist),col="red")
atau secara numerik.
# Compute empirical cumulative distribution
nn.sim.ecdf = ecdf(nn.sim)
# See how the original stat compares to the simulated distribution
nn.sim.ecdf(mean(nncross(split(P)$A,split(P)$B)$dist))
Perhatikan bahwa rata-rata statistik tetangga terdekat mungkin bukan ukuran statistik terbaik untuk masalah Anda. Statistik seperti fungsi-K bisa lebih terbuka (lihat jawaban whuber).
Di atas dapat dengan mudah diimplementasikan di dalam ArcGIS menggunakan Modelbuilder. Dalam satu lingkaran, secara acak menugaskan kembali nilai atribut untuk setiap titik kemudian menghitung statistik spasial. Anda harus bisa menghitung hasilnya dalam sebuah tabel.
spatstat
paket.
Anda mungkin ingin memeriksa CrimeStat.
Menurut situs web:
CrimeStat adalah program statistik spasial untuk analisis lokasi kejadian kejahatan, yang dikembangkan oleh Ned Levine & Associates, yang didanai oleh hibah dari National Institute of Justice (hibah 1997-IJ-CX-0040, 1999-IJ-CX-0044, 2002-IJ-CX-0007, dan 2005-IJ-CX-K037). Program ini berbasis Windows dan antarmuka dengan sebagian besar program GIS desktop. Tujuannya adalah untuk menyediakan alat statistik tambahan untuk membantu lembaga penegak hukum dan peneliti peradilan pidana dalam upaya pemetaan kejahatan mereka. CrimeStat digunakan oleh banyak departemen kepolisian di seluruh dunia dan juga oleh peradilan pidana dan peneliti lainnya. Versi terbaru adalah 3.3 (CrimeStat III).
Pendekatan yang sederhana dan cepat dapat membuat peta panas dan peta perbedaan dari dua peta panas tersebut. Terkait: Bagaimana membangun peta panas yang efektif?
Andaikata Anda telah mengulas literatur tentang Korelasi-Otomatis Spasial. ArcGIS memiliki berbagai alat titik dan klik untuk melakukan ini untuk Anda melalui skrip Toolbox: Alat Statistik Spasial -> Analisis Pola .
Anda dapat bekerja mundur - Temukan alat dan tinjau algoritma yang diterapkan untuk melihat apakah itu cocok dengan skenario Anda. Saya menggunakan Moran's Index beberapa waktu lalu ketika menyelidiki hubungan spasial dalam terjadinya mineral tanah.
Anda dapat menjalankan analisis korelasi bivariat di banyak perangkat lunak statistik untuk menentukan tingkat korelasi statistik antara dua variabel dan tingkat signifikansi. Anda kemudian dapat membuat cadangan temuan statistik Anda dengan memetakan satu variabel menggunakan skema chloropleth, dan variabel lainnya menggunakan simbol bertingkat. Setelah overlay, Anda kemudian dapat menentukan area mana yang menampilkan hubungan spasial tinggi / tinggi, tinggi / rendah dan rendah / rendah. Presentasi ini memiliki beberapa contoh bagus.
Anda juga dapat mencoba beberapa perangkat lunak geovisualisasi yang unik. Saya sangat suka CommonGIS untuk jenis visualisasi ini. Anda dapat memilih lingkungan (contoh Anda) dan semua statistik dan plot berguna akan tersedia untuk Anda segera. Itu membuat analisis peta multi variabel cukup mudah.
Analisis kuadrat akan bagus untuk ini. Ini adalah pendekatan GIS yang dapat menyoroti dan membandingkan pola spasial dari berbagai lapisan data titik.
Garis besar analisis kuadrat yang mengukur hubungan spasial antara beberapa lapisan data titik dapat ditemukan di http://www.nccu.edu/academics/sc/artsandsciences/geospatialscience/_documents/se_daag_poster.pdf .