L2 jarak, seperti yang disarankan dalam komentar oleh user39665. Ini adalah:
Perhatikan bahwa, seperti yang terlihat misalnya dalam bagian 8.1.8 dari buku masak matriks :
sehingga ini dapat dievaluasi dengan mudah dalam waktu .L2(P,Q)2=∫(p(x)−q(x))2dx=∫(∑iαipi(x)−∑jβjqj(x))2dx=∑i,i′αiαi′∫pi(x)pi′(x)dx+∑j,j′βjβj′∫qj(x)qj′(x)dx−2∑i,jαiβj∫pi(x)qj(x)dx.
∫N(x;μ,Σ)N(x;μ′,Σ′)dx=N(μ;μ′,Σ+Σ′)
O(mn)
Perbedaan rata-rata maksimum (MMD) dengan kernel Gaussian RBF. Ini adalah jarak yang keren, belum terkenal di antara komunitas statistik, yang membutuhkan sedikit matematika untuk didefinisikan.
Membiarkan
tentukan ruang Hilbert sebagai kernel Hilbert mereproduksi sesuai dengan : .k(x,y):=exp(−12σ2∥x−y∥2),
Hkk(x,y)=⟨φ(x),φ(y)⟩H
Tentukan kernel peta rata - rata sebagai
K(P,Q)=EX∼P,Y∼Qk(X,Y)=⟨EX∼Pφ(X),EY∼Qφ(Y)⟩.
MMD kemudian
MMD(P,Q)=∥EX∼P[φ(X)]−EY∼Q[φ(Y)]∥=K(P,P)+K(Q,Q)−2K(P,Q)−−−−−−−−−−−−−−−−−−−−−−−−−√=supf:∥f∥H≤1EX∼Pf(X)−EY∼Qf(Y).
Untuk campuran dan , perhatikan bahwa
dan demikian pula untuk dan .PQK(P,Q)=∑i,jαiβjK(Pi,Qj)
K(P,P)K(Q,Q)
Ternyata, menggunakan trik serupa seperti untuk , bahwa adalah
L2K(N(μ,Σ),N(μ′,Σ′))(2πσ2)d/2N(μ;μ′,Σ+Σ′+σ2I).
Sebagai , jelas ini menyatu dengan kelipatan dari jarak . Anda biasanya ingin menggunakan berbeda , meskipun, satu pada skala variasi data.σ→0L2σ
Formulir tertutup juga tersedia untuk kernel polinomial dalam MMD; Lihatk
Muandet, Fukumizu, Dinuzzo, dan Schölkopf (2012). Belajar dari Distribusi melalui Mesin Pengukur Dukungan. Dalam Kemajuan dalam Sistem Pemrosesan Informasi Saraf Tiruan ( versi resmi ). arXiv: 1202.6504 .
Untuk banyak properti bagus dari jarak ini, lihat
Sriperumbudur, Gretton, Fukumizu, Schölkopf, dan Lanckriet (2010). Embeddings dan metrik ruang Hilbert pada ukuran probabilitas. Jurnal Penelitian Pembelajaran Mesin, 11, 1517-1561 . arXiv: 0907.5309 .