Moran's I , ukuran autokorelasi spasial, bukan statistik yang sangat kuat (bisa sensitif terhadap distribusi atribut data spasial yang miring).
Apa sajakah teknik yang lebih kuat untuk mengukur autokorelasi spasial? Saya sangat tertarik dengan solusi yang sudah tersedia / dapat diterapkan dalam bahasa scripting seperti R. Jika solusi berlaku untuk keadaan / distribusi data yang unik, harap sebutkan yang ada di jawaban Anda.
EDIT : Saya memperluas pertanyaan dengan beberapa contoh (sebagai tanggapan atas komentar / jawaban atas pertanyaan awal)
Disarankan bahwa teknik permutasi (di mana distribusi sampling I Moran dihasilkan menggunakan prosedur Monte Carlo) menawarkan solusi yang kuat. Pemahaman saya adalah bahwa tes tersebut menghilangkan kebutuhan untuk membuat asumsi tentang distribusi I Moran (mengingat bahwa statistik uji dapat dipengaruhi oleh struktur spasial dari dataset) tetapi, saya gagal untuk melihat bagaimana teknik permutasi mengoreksi non-normal data atribut terdistribusi . Saya menawarkan dua contoh: satu yang menunjukkan pengaruh data miring pada statistik I Moran lokal, yang lain pada I global Moran - bahkan di bawah tes permutasi.
Saya akan menggunakan Zhang et al. 's (2008) menganalisis sebagai contoh pertama. Dalam makalah mereka, mereka menunjukkan pengaruh distribusi data atribut pada Moran lokal saya menggunakan tes permutasi (9999 simulasi). Saya telah mereproduksi hasil hotspot penulis untuk konsentrasi timbal (Pb) (pada tingkat kepercayaan 5%) menggunakan data asli (panel kiri) dan transformasi log dari data yang sama (panel kanan) di GeoDa. Boxplot dari konsentrasi Pb asli dan yang diubah log juga disajikan. Di sini, jumlah hot spot signifikan hampir dua kali lipat ketika data ditransformasikan; contoh ini menunjukkan bahwa statistik lokal adalah sensitif terhadap distribusi data atribut - bahkan ketika menggunakan teknik Monte Carlo!
Contoh kedua (data simulasi) menunjukkan pengaruh data miring dapat memiliki pada Moran's I global , bahkan ketika menggunakan tes permutasi. Contoh, dalam R , berikut:
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
Perhatikan perbedaan dalam nilai-P. Data miring menunjukkan bahwa tidak ada pengelompokan pada tingkat signifikansi 5% (p = 0,167) sedangkan data yang terdistribusi normal menunjukkan bahwa ada (p = 0,013).
Chaosheng Zhang, Lin Luo, Weilin Xu, Valerie Ledwith, Penggunaan I dan GIS Moran lokal untuk mengidentifikasi titik-titik polusi Pb di tanah perkotaan di Galway, Irlandia, Ilmu Lingkungan Total, Volume 398, Masalah 1-3, 15 Juli 2008 , Halaman 212-221