"Autokorelasi spasial" berarti berbagai hal bagi berbagai orang. Namun, konsep menyeluruh adalah bahwa suatu fenomena yang diamati di lokasi dapat bergantung pada beberapa cara tertentu pada (a) kovariat, (b) lokasi, dan (c) nilainya di lokasi terdekat . (Di mana definisi teknis berbeda-beda terletak pada jenis data yang dipertimbangkan, apa "cara pasti" yang dipostulatkan, dan apa yang "terdekat" artinya: semua ini harus dibuat kuantitatif untuk diproses.)z
Untuk melihat apa yang mungkin terjadi, mari kita pertimbangkan contoh sederhana model spasial semacam itu untuk menggambarkan topografi suatu wilayah. Biarkan ketinggian yang diukur pada suatu titik menjadi . Salah satu model yang mungkin adalah bahwa tergantung pada beberapa cara matematika pasti pada koordinat , yang akan saya tulis dalam situasi dua dimensi ini. Membiarkan mewakili penyimpangan (hipotetis independen) antara pengamatan dan model (yang seperti biasanya diasumsikan memiliki nol harapan), kita dapat menuliszy(z)yz(z1,z2)ε
y(z)=β0+β1z1+β2z2+ε(z)
untuk model tren linier . Tren linear (diwakili oleh dan ) adalah salah satu cara untuk menangkap gagasan bahwa nilai terdekat dan , untuk close to , harus cenderung dekat satu sama lain. Kita bahkan dapat menghitung ini dengan mempertimbangkan nilai yang diharapkan dari ukuran perbedaan antara dan , . Ternyata matematika banyakβ1β2y(z)y(z′)zz′y(z)y(z′)E[|y(z)−y(z′)|]lebih sederhana jika kita menggunakan ukuran perbedaan yang sedikit berbeda: sebagai gantinya, kita menghitung perbedaan kuadrat yang diharapkan :
E[(y(z)−y(z′))2]=E[(β0+β1z1+β2z2+ε(z)−(β0+β1z′1+β2z′2+ε(z′)))2]=E[(β1(z1−z′1)+β2(z2−z2)′+ε(z)−ε(z′))2]=E[(β1(z1−z′1)+β2(z2−z2)′)2+2(β1(z1−z′1)+β2(z2−z2)′)(ε(z)−ε(z′))+(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]
Model ini bebas dari autokorelasi spasial eksplisit, karena tidak ada istilah di dalamnya yang secara langsung menghubungkan dengan nilai terdekat .y(z)y(z′)
Alternatif, berbeda, model mengabaikan tren linier dan hanya mengandaikan bahwa ada autokorelasi. Salah satu cara untuk melakukannya adalah melalui struktur penyimpangan . Kita mungkin menempatkan ituε(z)
y(z)=β0+ε(z)
dan, untuk memperhitungkan antisipasi kita terhadap korelasi, kita akan mengasumsikan semacam "struktur kovarians" untuk . Agar ini bermakna secara spasial, kita akan mengasumsikan kovarian antara dan , sama dengan karena memiliki rata-rata nol, cenderung berkurang karena dan menjadi semakin jauh. Karena detailnya tidak masalah, sebut saja kovarian . Ini adalah autokorelasi spasial.εε(z)ε(z′)E[ε(z)ε(z′)]εzz′C(z,z′) Memang, korelasi (biasanya Pearson) antara dan adalahy(z)y(z′)
ρ(y(z),y(z′))=C(z,z′)C(z,z)C(z′,z′)−−−−−−−−−−−−√.
Dalam notasi ini, perbedaan kuadrat sebelumnya yang diharapkan dari untuk model pertama adalahy
E[(y(z)−y(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+C1(z,z)+C1(z′,z′)
(dengan asumsi ) karena di lokasi yang berbeda telah diasumsikan independen. Saya telah menulis alih-alih untuk menunjukkan ini adalah fungsi kovarians untuk model pertama.z≠z′εC1C
Ketika kovarian dari tidak bervariasi secara dramatis dari satu lokasi ke lokasi lain (memang, mereka biasanya dianggap konstan), persamaan ini menunjukkan bahwa perbedaan kuadrat yang diharapkan dalam meningkat secara kuadratik dengan pemisahan antara dan . Jumlah aktual peningkatan ditentukan oleh koefisien tren dan .εyzz′β0β1
Mari kita lihat apa perbedaan kuadrat yang diharapkan pada model untuk model baru, model 2:y
E[(y(z)−y(z′))2]=E[(β0+ε(z)−(β0+ε(z′)))2]=E[(ε(z)−ε(z′))2]=E[ε(z)2−2ε(z)ε(z′)+ε(z′)2]=C2(z,z)−2C2(z,z′)+C2(z′,z′).
Sekali lagi ini berperilaku dengan cara yang benar: karena kami memperkirakan akan berkurang ketika dan menjadi lebih terpisah, perbedaan kuadrat yang diharapkan dalam 's memang pergi naik dengan meningkatnya pemisahan lokasi.C2(z,z′)zz′y
Membandingkan dua ekspresi untuk dalam dua model menunjukkan kepada kita yang dalam model pertama memainkan peran yang secara matematis identik dengan dalam model kedua. (Ada konstanta aditif yang mengintai di sana, terkubur dalam arti berbeda dari , tetapi tidak masalah dalam analisis ini.) Ergo , tergantung pada model, korelasi spasial biasanya digambarkan sebagai beberapa kombinasi tren dan struktur korelasi yang ditetapkan pada kesalahan acak.E[(y(z)−y(z′))2](β1(z1−z′1)+β2(z2−z2)′)2−2C2(z,z′)Ci(z,z)
Saya harap, sekarang kita memiliki jawaban yang jelas untuk pertanyaan: seseorang dapat mewakili gagasan di balik Hukum Geografi Tobler ("semuanya terkait dengan yang lain, tetapi hal-hal yang lebih dekat lebih terkait") dengan cara yang berbeda. Dalam beberapa model, Hukum Tobler diwakili secara memadai dengan memasukkan tren (atau istilah "drift") yang merupakan fungsi dari koordinat spasial seperti bujur dan lintang. Dalam kasus lain, Hukum Tobler ditangkap dengan menggunakan struktur kovarians nontrivial di antara istilah acak tambahan (theε). Dalam praktiknya, model menggabungkan kedua metode. Yang mana yang Anda pilih tergantung pada apa yang ingin Anda capai dengan model dan pada pandangan Anda tentang bagaimana autokorelasi spasial muncul - apakah itu tersirat oleh tren yang mendasari atau mencerminkan variasi yang ingin Anda pertimbangkan secara acak. Tidak ada yang selalu benar dan, dalam masalah apa pun, sering kali mungkin menggunakan kedua jenis model untuk menganalisis data, memahami fenomena, dan memperkirakan nilainya di lokasi lain (interpolasi).