Berapa distribusi jarak Euclidean antara dua variabel acak yang terdistribusi normal?

Asumsikan Anda diberikan dua objek yang lokasi pastinya tidak diketahui, tetapi didistribusikan sesuai dengan distribusi normal dengan parameter yang diketahui (misalnya $a \sim N(m, s)$ dan $b \sim N(v, t))$ . Kita dapat mengasumsikan ini adalah normal bivariat, sehingga posisinya dijelaskan oleh distribusi di atas $(x,y)$ koordinat (yaitu $m$ dan $v$ adalah vektor yang berisi koordinat yang diharapkan $(x,y)$ untuk $a$ dan masing-masing). Kami juga akan menganggap objek independen. $b$

Apakah ada yang tahu jika distribusi jarak Euclidean kuadrat antara dua objek ini adalah distribusi parametrik yang dikenal? Atau bagaimana cara menurunkan PDF / CDF untuk fungsi ini secara analitik?

normal-distribution distance-functions

— Nick
sumber

Anda harus mendapatkan kelipatan dari distribusi chi-kuadrat non-pusat asalkan keempat koordinat tidak berkorelasi. Kalau tidak, hasilnya terlihat jauh lebih rumit.

— whuber

@whuber detail / petunjuk yang dapat Anda berikan tentang bagaimana parameter dari distribusi chi-kuadrat non-pusat yang dihasilkan berhubungan dengan objek-objek a, b akan fantastis

— Nick

@Klik beberapa paragraf pertama artikel Wikipedia memberikan detailnya. Dengan melihat fungsi karakteristik Anda dapat menetapkan bahwa hasil yang serupa tidak tersedia ketika tidak semua variansinya sama atau ada beberapa korelasi.

— whuber

@Nick, hanya untuk memperjelas, baik

dan

adalah vektor acak dengan nilai dalam

a

$a$

b

$b$

R^{2}

$\mathbb{R}^2$

— mpiktas

@ Nick, jika

dan

secara bersama-sama normal, maka perbedaan adalah

adalah normal juga. Maka masalah Anda adalah menemukan distribusi vektor normal acak. Googling saya menemukan tautan ini . Makalah ini menjelaskan masalah yang jauh lebih kompleks yang khususnya bertepatan dengan masalah Anda. Ini memberi harapan bahwa ada jawaban yang pasti untuk pertanyaan Anda. Referensi mungkin memberi Anda ide lebih lanjut ke mana harus mencari.

a

$a$

b

$b$

a - b

$a-b$

— mpiktas

Jawaban:

Jawaban untuk pertanyaan ini dapat ditemukan dalam buku Bentuk kuadrat dalam variabel acak oleh Mathai dan Provost (1992, Marcel Dekker, Inc.).

Seperti yang dikomentari oleh komentar, Anda perlu menemukan distribusi mana mengikuti distribusi normal bivariat dengan mean dan matriks kovarian . Ini adalah bentuk kuadrat dalam variabel acak bivariat . $Q = z_1^2 + z_2^2$ $z = a - b$ $\mu$ $\Sigma$ $z$

Secara singkat, satu hasil umum yang bagus untuk kasus berdimensi mana dan adalah bahwa fungsi pembangkit momen $p$ $z \sim N_p(\mu, \Sigma)$

Q = \sum_{j = 1}^{p} z_{j}^{2}

$Q = \sum_{j=1}^p z_j^2$

di mana

adalah nilai eigen dari

dan

merupakan fungsi linear dari

. Lihat Teorema 3.2a.2 (halaman 42) dalam buku yang dikutip di atas (kita asumsikan di sini bahwa

adalah non-tunggal). Representasi lain yang berguna adalah 3.1a.1 (halaman 29)

E (e^{t Q}) = e^{t \sum_{j = 1}^{p} \frac{b_{j}^{2} λ_{j}}{1 - 2 t λ_{j}}} \prod_{j = 1}^{p} (1 - 2 t λ_{j})^{- 1 / 2}

$E(e^{tQ}) = e^{t \sum_{j=1}^p \frac{b_j^2 \lambda_j}{1-2t\lambda_j}}\prod_{j=1}^p (1-2t\lambda_j)^{-1/2}$

λ_{1}, \dots, λ_{p}

$\lambda_1, \ldots, \lambda_p$

Σ

$\Sigma$

b

$b$

μ

$\mu$

Σ

$\Sigma$

mana

iid

Q = \sum_{j = 1}^{p} λ_{j} (u_{j} + b_{j})^{2}

$Q = \sum_{j=1}^p \lambda_j(u_j + b_j)^2$

u_{1}, \dots, u_{p}

$u_1, \ldots, u_p$

N (0, 1)

$N(0, 1)$

Seluruh Bab 4 dalam buku ini ditujukan untuk representasi dan perhitungan kepadatan dan fungsi distribusi, yang sama sekali tidak sepele. Saya hanya akrab dengan buku ini, tetapi kesan saya adalah bahwa semua representasi umum adalah dalam hal ekspansi seri tak terbatas.

$\lambda_1, \lambda_2 > 0$ $b_1, b_2 \in \mathbb{R}$

$a$ $b$ $a-b$

— NRH
sumber

Terima kasih atas rujukannya, saya menemukan buku itu dan perlahan-lahan mencoba untuk menerobosnya

— Nick

λ_{j} = σ^{2}

$\lambda_j = \sigma^2$

p = 2

$p=2$

b_{j}^{2} λ_{j}

$b_j^2 \lambda_j$

μ_{j}^{2}

$\mu_j^2$

b_{j}

$b_j$

μ_{j}^{2}

$\mu_j^2$

$\mu_d = \mu_1 - \mu_2$ $\Sigma_d = \Sigma_1 + \Sigma_2$ $\Sigma_d = \mathrm{J} \Sigma_{12} \mathrm{J}^T$ $\Sigma_{12} = \begin{bmatrix} \Sigma_1 & \\ & \Sigma_2 \end{bmatrix}$ $\mathrm{J} = \begin{bmatrix} +\mathrm{I}, & -\mathrm{I} \end{bmatrix}$

Kedua, cari distribusi panjang vektor perbedaan, atau jarak radial dari titik asal, yang didistribusikan Hoyt :

Jari-jari di sekitar rata-rata sebenarnya dalam variabel acak normal berkorelasi bivariat dengan varians yang tidak sama, ditulis ulang dalam koordinat polar (radius dan sudut), mengikuti distribusi Hoyt. Pdf dan cdf didefinisikan dalam bentuk tertutup, pencarian akar numerik digunakan untuk menemukan cdf ^ −1. Mengurangi distribusi Rayleigh jika korelasinya 0 dan variansinya sama.

Distribusi yang lebih umum muncul jika Anda mengizinkan perbedaan yang bias (asal bergeser), dari Ballistipedia :

— Felipe G. Nievinski
sumber

+1, tapi saya pikir ada baiknya untuk menunjukkan bahwa pertanyaan tersebut berkaitan dengan apa yang disebut oleh figur Anda sebagai "Kasus umum".

— Amoeba berkata Reinstate Monica

Mengapa tidak mengujinya?

set.seed(347)
x <- rnorm(10000)
y <- rnorm(10000)
x2 <- rnorm(10000)
y2 <- rnorm(10000)

qdf <- data.frame(x,y,x2,y2)
qdf <- data.frame(qdf,(x-x2)^2+(y-y2)^2)
colnames(qdf)[5] <- "euclid" 

plot(c(x,y),c(x2,y2))
plot(qdf$euclid)
hist(qdf$euclid) 
plot(dentist(qdf$euclid))

Plot 1 Plot 2 Plot 3 Plot 4

— Brandon Bertelsen
sumber

komentar whubers terhadap pertanyaan awal sudah menyatakan seperti apa jadinya jika variansnya sama dan variabelnya tidak berkorelasi. Mungkin memberi contoh dimana ini bukan masalahnya akan lebih mencerahkan.

— Andy W

Bisakah Anda memberikan contoh seperti itu?

— Brandon Bertelsen

yang perlu Anda lakukan adalah menghasilkan nilai x dan y yang berkorelasi atau memiliki varian yang berbeda. Perbedaan yang berbeda dapat dilakukan dengan benar dalam kode sebagaimana adanya. Anda bisa menghasilkan nilai dari matriks kovarians yang ditentukan menggunakan mvrnorm dari paket MASS. Juga saya tidak yakin apa fungsi "dokter gigi" dalam kode di atas, apakah mungkin "kepadatan".

— Andy W

Yang sedang dikatakan itu mungkin sama mencerahkan untuk bekerja melalui matematika untuk melihat mengapa ini terjadi (dan bagaimana memanipulasi varians / kovarian akan mengubah distribusi). Tidak sepenuhnya jelas bagi saya mengapa ini terjadi hanya dengan melihat fungsi karakteristik yang disebutkan oleh whuber. Sepertinya pemahaman sederhana tentang aturan untuk menambah, mengurangi, dan mengalikan variabel acak akan membantu Anda memahami mengapa itu terjadi.

— Andy W