Intro As @vqv menyebutkan variasi total dan Kullback Leibler adalah dua jarak yang menarik. Yang pertama bermakna karena dapat langsung berhubungan dengan kesalahan tipe pertama dan kedua dalam pengujian hipotesis. Masalah dengan Total variasi jarak adalah sulit untuk dihitung. Jarak Kullback Leibler lebih mudah untuk dihitung dan saya akan membahasnya nanti. Ini tidak simetris tetapi dapat dibuat simetris (entah bagaimana sedikit buatan).
Jawaban Sesuatu yang saya sebutkan di sini adalah bahwa jika adalah rasio kemungkinan log antara dua ukuran gaussian Anda (katakan bahwa untuk memiliki ukuran kesalahan rata-rata dan kovarians ) yang juga menarik perhatian (dalam kasus gaussian saya menemukannya cukup sentral sebenarnya) adalahLP0,P1i=0,1 PiμiCi
∥L∥2L2(P1/2)
untuk dipilih dengan baik .P1/2
Dengan kata sederhana :
- mungkin ada rotasi "arah" menarik yang berbeda, yang diperoleh dengan menggunakan rumus Anda dengan salah satu dari matriks kovarians "interpolasi" ( atau ) didefinisikan di akhir posting ini (nomor adalah yang Anda usulkan dalam komentar Anda untuk pertanyaan Anda). Σ=Ci,1/2i=1,2,3,455
- karena dua distribusi Anda memiliki kovarian yang berbeda, tidak cukup untuk membandingkan cara , Anda juga perlu membandingkan kovarian.
Biarkan saya menjelaskan kepada Anda mengapa ini adalah perasaan saya, bagaimana Anda dapat menghitung ini dalam kasus dan bagaimana memilih .C1≠C0P1/2
linier Jika .C1=C0=Σ
σ=ΔΣ−1Δ=∥2L∥2L2(P1/2)
di mana adalah "interpolasi" antara dan (gaussian dengan covariance dan mean ). Perhatikan bahwa dalam kasus ini, jarak Hellinger, jarak variasi total semua dapat ditulis menggunakan .P1/2P1P0Σ(μ1+μ0)/2σ
Cara menghitung dalam kasus umumL Sebuah pertanyaan alami yang muncul dari pertanyaan Anda (dan pertanyaan saya ) adalah "interpolasi" alami antara dan saat . Di sini kata natural mungkin spesifik untuk pengguna tetapi misalnya itu mungkin terkait dengan interpolasi terbaik untuk memiliki batas atas yang ketat dengan jarak lain (misalnya jarak sini )P1P0C1≠C0L1
Menulis
( ) dapat membantu melihat di mana tugas interpolasi, tetapi:
L=ϕ(C−1/2i(x−μi))−ϕ(C−1/2j(x−μj))−12log(CiC−j)
i=0,j=1
L(x)=−12⟨Aij(x−sij),x−sij⟩Rp+⟨Gij,x−sij⟩Rp−cij,[1]
dengan
Aij=C−i−C−j,Gij=Sijmij,Sij=C−i+C−j2,
cij=18⟨Aijmij,mij⟩Rp+12log|det(C−jCi)|
dan
mij=μi−μjandsij=μi+μj2
lebih relevan untuk tujuan komputasi. Untuk setiap gaussian dengan mean dan kovarian perhitungan dari Persamaan sedikit teknis tapi cukup. Anda mungkin juga menggunakannya untuk menghitung jarak leibler Kulback.P1/2s01C∥L∥2L2(P1/2)1
Interpolasi apa yang harus kita pilih (yaitu bagaimana memilih )P1/2
Jelas dipahami dari Persamaan bahwa ada banyak kandidat berbeda untuk (interpolasi) dalam kasus "kuadratik". Dua kandidat yang saya temukan "paling alami" (subyektif :)) muncul dari mendefinisikan untuk distribusi gaussian dengan rata-rata :1P1/2t∈[0,1]Pttμ1+(1−t)μ0
- P1t sebagai distribusi (di mana diambil dari ) yang memiliki kovarian ).
ξt=tξ1+(1−t)ξ0
ξiPi i=0,1Ct,1=(tC1/21+(1−t)C1/20)2
- P2t dengan kovarians terbalikC−1t,2=tC−11+(1−t)C−10
- P3t dengan kovariansCt,3=tC1+(1−t)C0
- P4t dengan kovarians terbalikC−1t,4=(tC−1/21+(1−t)C−1/20)2
EDIT: Yang Anda ajukan dalam komentar untuk pertanyaan Anda bisa , mengapa tidak ...Ct,5=Ct1C1−t0
Saya punya pilihan favorit saya yang bukan yang pertama :) tidak punya banyak waktu untuk membahasnya di sini. Mungkin saya akan mengedit jawaban ini nanti ...