Apa alasan fungsi kovarian Matérn?


19

Fungsi kovarians Matérn umumnya digunakan sebagai fungsi kernel dalam Proses Gaussian. Ini didefinisikan seperti ini

Cν(d)=σ221νΓ(ν)(2νdρ)νKν(2νdρ)

di mana d adalah fungsi jarak (seperti jarak Euclidean), Γ adalah fungsi gamma, Kν adalah fungsi Bessel yang dimodifikasi dari jenis kedua, ρ dan ν adalah parameter positif. ν banyak waktu yang dipilih untuk menjadi 32 atau52 dalam praktek.

Banyak waktu kernel ini bekerja lebih baik daripada kernel Gaussian standar karena 'kurang lancar', tetapi kecuali itu, apakah ada alasan lain mengapa seseorang lebih memilih kernel ini? Beberapa intuisi geometris tentang bagaimana perilakunya, atau penjelasan tentang rumus yang tampaknya samar akan sangat dihargai.

Jawaban:


18

Selain jawaban bagus @DahnJahn, saya pikir saya akan mencoba untuk mengatakan sedikit lebih banyak tentang dari mana fungsi Bessel dan gamma berasal. Satu titik awal untuk tiba di fungsi kovarian adalah teorema Bochner.

Teorema (Bochner) Fungsi stasioner kontinu adalah pasti positif jika dan hanya jika ˜ k adalah transformasi Fourier dari ukuran positif hingga: ˜ k ( t ) = R e - i ω t d µ ( ω )k(x,y)=k~(|xy|)k~

k~(t)=Reiωtdµ(ω)

Dari sini Anda dapat menyimpulkan bahwa matriks kovarians Matérn diturunkan sebagai transformasi Fourier dari (Sumber). Itu semua baik tetapi tidak benar-benar memberi tahu kami bagaimana Anda sampai pada ukuran positif terbatas yang diberikan oleh11(1+ω2)p . Ya, ini adalah kerapatan spektral (daya) dari proses stokastikf(x).1(1+ω2)pf(x)

Proses stokastik yang mana? Ini diketahui bahwa proses acak pada dengan fungsi kovarians Matern adalah solusi untuk persamaan diferensial parsial stokastik (SPDE) ( κ 2 - Δ ) α / 2 X ( s ) = φ W ( s ) , di mana W ( s ) adalah Gaussian white noise dengan varians unit, Δ = d i = 1 2Rd

(κ2)α/2X(s)=φW(s),
W(s) adalah operator Laplace, danα=ν+d/2(saya pikir ini ada diCressie dan Wikle).
Δ=i=1d2xi2
α=ν+d/2

Mengapa memilih SPDE / proses stokastik tertentu ini? Asal adalah statistik spasial di mana itu berpendapat yang paling sederhana dan kovariansi alami yang bekerja dengan baik dalam :R2

Fungsi korelasi eksponensial adalah korelasi alami dalam satu dimensi, karena sesuai dengan proses Markov. Dalam dua dimensi ini tidak lagi demikian, meskipun eksponensial adalah fungsi korelasi umum dalam pekerjaan geostatistik. Whittle (1954) menentukan korelasi yang sesuai dengan persamaan diferensial stokastik tipe Laplace:

di manaεadalah white noise. Proses kisi diskrit yang sesuai adalah autoregresi orde kedua. (Sumber)

[(t1)2+(t2)2κ2]X(t1,t2)=ϵ(t1,t2)
ϵ

Keluarga proses yang termasuk dalam SDE yang terkait dengan persamaan Matern termasuk model Ornstein-Uhlenbeck dari kecepatan partikel yang mengalami gerakan Brown. Lebih umum, Anda dapat menentukan spektrum daya untuk keluarga A R ( p ) proses untuk setiap bilangan bulat p yang juga memiliki keluarga kovarians Matern. Ini ada dalam lampiran Rasmussen dan Williams.AR(1)AR(p)p

Fungsi kovarians ini tidak terkait dengan proses cluster Matérn.

Referensi

Cressie, Noel, dan Christopher K. Wikle. Statistik untuk data spatio-temporal. John Wiley & Sons, 2015.

Guttorp, Peter, dan Tilmann Gneiting. "Studi dalam sejarah probabilitas dan statistik XLIX Pada keluarga korelasi Matern." Biometrika 93.4 (2006): 989-995.

Rasmussen, CE dan Williams, Proses Gaussian CKI untuk Pembelajaran Mesin. MIT Press, 2006.


2
Dalam kasus satu dimensi, kovarians Matern dengan bentuk dengan p bilangan bulat positif adalah bahwa dari waktu berkelanjutan proses autoregressive CAR ( p ) order p . Namun, tidak semua model CAR ( p ) memiliki kovarians Matern. ν=p1/2pCAR(p)pCAR(p)
Yves

Itu kesalahpahaman yang jelas di pihak saya, saya akan memperbarui jawabannya. Terima kasih!
MachineEpsilon

16

Saya tidak tahu, tetapi saya menemukan pertanyaan ini sangat menarik dan inilah yang saya dapatkan setelah sedikit membacanya.

Untuk nilai tertentu , fungsi kovarians Matérn dapat dinyatakan sebagai produk eksponensial dan polinomial. Misalnya untuk ν = 5 / 2 : C 5 / 2 ( d ) =νν=5/2 Maka tidak terlalu mengejutkan bahwa, sepertiν,Cνbenar-benar bertemu denganGaussian RBF: limνCν(d)=σ2exp

C5/2(d)=σ2(1+5dρ+5d23ρ2)exp(5dρ)
νCν Untukν=1/2, fungsi kovarians Matern memberikan mutlak eksponensial kernel C1/2(d)=σ2exp
limνCν(d)=σ2exp(d22ρ2)
ν=1/2
C1/2(d)=σ2exp(dρ)

Selanjutnya, proses Gaussian dengan fungsi kovarian Matérn dengan parameter adalahνν1

Ini ditunjukkan dengan sangat baik pada gambar yang diambil dari Rasmussen & Williams (2006) CE Rasmussen & CKI Williams, Proses Gaussian untuk Pembelajaran Mesin, MIT Press, 2006, ISBN 026218253X.  c 2006 Institut Teknologi Massachusetts.  www.GaussianProcess.org/gpml

Dalam Interpolasi Data Spasial , Stein (yang sebenarnya mengusulkan nama fungsi kovarians Matérn), berpendapat (hal 30) bahwa diferensiasi tak terbatas dari fungsi kovarians Gaussian menghasilkan hasil yang tidak realistis untuk proses fisik, karena hanya mengamati sebagian kecil dari ruang / waktu seharusnya, secara teori, menghasilkan seluruh fungsi. Dia kemudian mengusulkan versi Matérn sebagai generalisasi yang mampu menyamakan proses fisik dengan lebih realistis.

Ringkasan

Fungsi kovarians Matérn dapat dilihat sebagai a ν

ν mengapa semua itu benar.


1
(+1) Saya ingin tahu apakah ada penjelasan atau derivasi fungsi kovarians ini di buku Matérn pub.epsilon.slu.se/10033/1/… ? Saya belum dapat menemukannya sejauh ini. Fungsi kovarian ini sepertinya memiliki tempat yang sangat menonjol dalam buku Stein, jadi saya ingin tahu lebih banyak.
MachineEpsilon

@Machineepsilon apakah Matérn benar-benar menyebutkan / mendefinisikan fungsi? Saya mendapat firasat dari buku Stein bahwa dialah yang membuatnya dan menamainya dengan nama Matérn.
Dahn

Saya tidak yakin, itulah yang ingin saya ketahui! Saya akan coba memeriksanya karena Rasmussen juga merujuk buku itu.
MachineEpsilon
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.