Distribusi sampel dari jari-jari distribusi normal 2D

Distribusi normal bivariat dengan mean dan matriks kovarians dapat ditulis ulang dalam koordinat polar dengan jari-jari dan sudut . Pertanyaan saya adalah: Apa distribusi sampling , yaitu, dari jarak dari titik ke estimasi pusat diberi matriks kovarian sampel ? $\mu$ $\Sigma$ $r$ $\theta$ $\hat{r}$ $x$ $\bar{x}$ $S$

Latar Belakang: Jarak sebenarnya $r$ dari titik $x$ ke mean $\mu$ mengikuti distribusi Hoyt . Dengan nilai eigen $\lambda_{1}, \lambda_{2}$ dari $\Sigma$ , dan $\lambda_{1} > \lambda_{2}$ , parameter bentuknya adalah $q=\frac{1}{\sqrt{(\lambda_{1}+\lambda_{2})/\lambda_{2})-1}}$ , dan parameter skalanya adalah $\omega = \lambda_{1} + \lambda_{2}$ . Fungsi distribusi kumulatif dikenal sebagai perbedaan simetris antara dua fungsi-Marcum.

Simulasi menunjukkan bahwa memasukkan perkiraan $\bar{x}$ dan $S$ untuk $\mu$ dan $\Sigma$ ke dalam cdf yang sebenarnya berfungsi untuk sampel besar, tetapi tidak untuk sampel kecil. Diagram berikut menunjukkan hasil dari 200 kali

mensimulasikan 20 vektor normal 2D untuk setiap kombinasi dari diberikan $q$ ( $x$ -aksi), $\omega$ (baris), dan kuantil (kolom)
untuk setiap sampel, menghitung kuantil tertentu dari radius yang diamati $\hat{r}$ sampai $\bar{x}$
untuk setiap sampel, menghitung kuantil dari Hoyt teoritis (2D normal) cdf, dan dari cdf Rayleigh teoritis setelah menghubungkannya dengan perkiraan sampel $\bar{x}$ dan $S$ .

masukkan deskripsi gambar di sini

Saat mendekati 1 (distribusinya menjadi melingkar), estimasi Hoyt quantiles mendekati perkiraan Rayleigh quantiles yang tidak terpengaruh oleh . Ketika tumbuh, perbedaan antara kuantil empiris dan yang diperkirakan meningkat, terutama di bagian ujung distribusi. $q$ $q$ $\omega$

— caracal
sumber

Apa pertanyaannya?

— John

@ John I menyoroti pertanyaan: "Berapakah distribusi sampling dari [radius] , yaitu, dari jarak dari titik ke perkiraan pusat diberi matriks convariance matrix ?"

r

$r$

x

$x$

\bar{x}

$\bar{x}$

S

$S$

— caracal

Mengapa berlawanan dengan ?

\hat{r}

$\hat{r}$

\hat{r^{2}}

$\hat{r^2}$

— SomeEE

@ Madath hanya karena literatur yang saya tahu berkaitan dengan distribusi (true) , bukan (true) . Perhatikan bahwa ini tidak seperti situasi dengan jarak Mahalanobis yang dibahas dalam pertanyaan ini . Tentu saja, hasil untuk distribusi akan sangat disambut.

\hat{r}

$\hat{r}$

r

$r$

r^{2}

$r^{2}$

{\hat{r}}^{2}

$\hat{r}^{2}$

— caracal

Seperti yang Anda sebutkan di pos Anda, kami tahu distribusi estimasi jika kami diberikan sehingga kami tahu distribusi estimasi dari true . $\widehat{r_{true}}$ $\mu$ $\widehat{r^2_{true}}$ $r^2$

Kami ingin menemukan distribusi mana diekspresikan sebagai vektor kolom.

\hat{r^{2}} = \frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x})^{T} (x_{i} - \bar{x})

$\widehat{r^2} = \frac{1}{N}\sum_{i=1}^N (x_i-\overline{x})^T(x_i-\overline{x})$

x_{i}

$x_i$

Kami sekarang melakukan trik standar

\begin{array}{rcl} \hat{r_{t r u e}^{2}} & = & \frac{1}{N} \sum_{i = 1}^{N} (x_{i} - μ)^{T} (x_{i} - μ) \\ = & \frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x} + \bar{x} - μ)^{T} (x_{i} - \bar{x} + \bar{x} - μ) \\ = & [\frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x})^{T} (x_{i} - \bar{x})] + (\bar{x} - μ)^{T} (\bar{x} - μ) (1) \\ = & \hat{r^{2}} + (\bar{x} - μ)^{T} (\bar{x} - μ) \end{array}

$\begin{eqnarray*} \widehat{r^2_{true}} &=& \frac{1}{N}\sum_{i=1}^N(x_i - \mu)^T(x_i-\mu)\\ &=& \frac{1}{N}\sum_{i=1}^N(x_i-\overline{x} + \overline{x} -\mu)^T(x_i-\overline{x} + \overline{x}-\mu)\\ &=&\left[\frac{1}{N}\sum_{i=1}^N(x_i - \overline{x})^T(x_i-\overline{x})\right] + (\overline{x} - \mu)^T(\overline{x}-\mu) \hspace{20pt}(1)\\ &=& \widehat{r^2} + (\overline{x}-\mu)^T(\overline{x}-\mu) \end{eqnarray*}$ mana muncul dari persamaan dan transposnya.

(1)

$(1)$

\frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x})^{T} (\bar{x} - μ) = (\bar{x} - \bar{x})^{T} (\bar{x} - μ) = 0

$\frac{1}{N}\sum_{i=1}^N(x_i-\overline{x})^T(\overline{x}-\mu) = (\overline{x} - \overline{x})^T(\overline{x} - \mu) = 0$

Perhatikan bahwa adalah jejak dari matriks kovarian sampel dan hanya bergantung hanya pada mean sampel . Jadi kita telah menulis sebagai jumlah dari dua variabel acak independen. Kita tahu distribusi dan dan jadi kita selesai melalui trik standar menggunakan itu fungsi karakteristiknya multiplikatif. $\widehat{r^2}$ $S$ $(\overline{x}-\mu)^T(\overline{x}-\mu)$ $\overline{x}$

\hat{r_{t r u e}^{2}} = \hat{r^{2}} + (\bar{x} - μ)^{T} (\bar{x} - μ)

$\widehat{r_{true}^2} = \widehat{r^2} + (\overline{x}-\mu)^T(\overline{x}-\mu)$

\hat{r_{t r u e}^{2}}

$\widehat{r^2_{true}}$

(\bar{x} - μ)^{T} (\bar{x} - μ)

$(\overline{x} - \mu)^T(\overline{x}-\mu)$

Diedit untuk menambahkan:

$||x_i-\mu||$ adalah Hoyt sehingga memiliki pdf mana adalah fungsi Bessel dimodifikasi dari jenis pertama .

f (ρ) = \frac{1 + q^{2}}{q ω} ρ e^{- \frac{(1 + q^{2})^{2}}{4 q^{2} ω} ρ^{2}} I_{O} (\frac{1 - q^{4}}{4 q^{2} ω} ρ^{2})

$f(\rho) = \frac{1+q^2}{q\omega}\rho e^{-\frac{(1+q^2)^2}{4q^2\omega} \rho^2}I_O\left(\frac{1-q^4}{4q^2\omega} \rho^2\right)$

I_{0}

$I_0$

0^{t h}

$0^{th}$

Ini berarti pdf dari adalah $||x_i-\mu||^2$

f (ρ) = \frac{1}{2} \frac{1 + q^{2}}{q ω} e^{- \frac{(1 + q^{2})^{2}}{4 q^{2} ω} ρ} I_{0} (\frac{1 - q^{4}}{4 q^{2} ω} ρ) .

$f(\rho) = \frac{1}{2}\frac{1+q^2}{q\omega}e^{-\frac{(1+q^2)^2}{4q^2\omega}\rho}I_0\left(\frac{1-q^4}{4q^2\omega}\rho\right).$

Untuk memudahkan notasi, atur , dan . $a = \frac{1-q^4}{4q^2\omega}$ $b=-\frac{(1+q^2)^2}{4q^2\omega}$ $c=\frac{1}{2}\frac{1+q^2}{q\omega}$

Fungsi penghasil momen adalah $||x_i-\mu||^2$

{\begin{cases} \frac{c}{\sqrt{(s - b)^{2} - a^{2}}} & (s - b) > a \\ 0 & else \end{cases}

$\begin{cases} \frac{c}{\sqrt{(s-b)^2-a^2}} & (s-b) > a\\ 0 & \text{ else}\\ \end{cases}$

Dengan demikian fungsi penghasil momen dari adalah dan fungsi penghasil momen adalah $\widehat{r^2_{true}}$

{\begin{cases} \frac{c^{N}}{((s / N - b)^{2} - a^{2})^{N / 2}} & (s / N - b) > a \\ 0 & else \end{cases}

$\begin{cases} \frac{c^N}{((s/N-b)^2-a^2)^{N/2}} & (s/N-b) > a\\ 0 & \text{else} \end{cases}$

| | \bar{x} - μ | |^{2}

$||\overline{x} - \mu||^2$

{\begin{cases} \frac{N c}{\sqrt{(s - N b)^{2} - (N a)^{2}}} = \frac{c}{\sqrt{(s / N - b)^{2} - a^{2}}} & (s / N - b) > a \\ 0 & else \end{cases}

$\begin{cases} \frac{Nc}{\sqrt{(s-Nb)^2-(Na)^2}} = \frac{c}{\sqrt{(s/N-b)^2-a^2}} & (s/N-b) > a\\ 0 & \text{ else} \end{cases}$

Ini menyiratkan bahwa fungsi pembangkit momen adalah $\widehat{r^2}$

{\begin{cases} \frac{c^{N - 1}}{((s / N - b)^{2} - a^{2})^{(N - 1) / 2}} & (s / N - b) > a \\ 0 & else . \end{cases}

$\begin{cases} \frac{c^{N-1}}{((s/N-b)^2-a^2)^{(N-1)/2}} & (s/N-b) > a\\ 0 & \text{ else}. \end{cases}$

Menerapkan transformasi Laplace terbalik memberikan bahwa memiliki pdf $\widehat{r^2}$

g (ρ) = \frac{\sqrt{π} N c^{N - 1}}{Γ (\frac{N - 1}{2})} {(\frac{2 i a}{N ρ})}^{(2 - N) / 2} e^{b N ρ} J_{N / 2 - 1} (i a N ρ) .

$g(\rho) = \frac{\sqrt{\pi}Nc^{N-1}}{\Gamma(\frac{N-1}{2})}\left(\frac{2\mathrm{i} a}{N\rho}\right)^{(2 - N)/2} e^{b N \rho} J_{N/2-1}( \mathrm{i} a N \rho).$

— SomeEE
sumber

Terima kasih! Saya harus mengerjakan rinciannya sebelum menerima.

— caracal

\hat{r_{true}^{2}} \sim Hoyt

$\widehat{r^{2}_{\text{true}}} \sim \text{Hoyt}$ , dan ? Maka fungsi karakteristik adalah produk dari dua fungsi karakteristik seperti dijelaskan di sini . Itu memang menjawab pertanyaan saya. Apakah Anda tahu bagaimana kami dapat mengubah sedemikian rupa sehingga distribusinya diketahui tanpa akses ke ? Seperti jarak Mahalanobis, atau statistik univariat ?

| | \bar{x} - μ | |^{2} \sim N (0, \frac{1}{N} Σ)

$||\bar{x}-\mu||^{2} \sim \mathcal{N}(0, \frac{1}{N}\Sigma)$

\hat{r^{2}}

$\widehat{r^{2}}$

\hat{r^{2}}

$\widehat{r^{2}}$

Σ

$\Sigma$

t

$t$

— caracal

Saya telah mengedit jawaban saya untuk jawaban lengkap. Tolong beri tahu saya jika Anda setuju.

— SomeEE

Saya tidak yakin tentang tidak diketahui . Hal yang jelas harus dilakukan adalah mencoba untuk "membagi" dengan sampel kovarian yang akan terlihat seperti jumlah jarak Mahalanobis, yaitu pertimbangkan . Sayangnya jumlah ini selalu .

Σ

$\Sigma$

\hat{r^{2}}

$\widehat{r^2}$

S

$S$

\frac{1}{N} \sum_{i = 1}^{N} (x_{i} - \bar{x})^{T} S^{- 1} (x_{i} - \bar{x})

$\frac{1}{N} \sum_{i=1}^N(x_i - \overline{x})^T S^{-1}(x_i-\overline{x})$

1

$1$

— SomeEE

Terima kasih untuk terus mengerjakan jawabannya! Saya tidak yakin tentang distribusi . Saya tidak bisa melakukan kesepakatan dengan ini analitis, tetapi simulasi cepat memberikan distribusi yang berbeda dari : R kode simulasi . Meskipun bisa jadi saya tidak mengerti dengan benar parametrization .

| | x_{i} - μ | |^{2}

$||x_{i}-\mu||^{2}$

r^{2}

$r^{2}$

Γ (q, \frac{ω}{q})

$\Gamma(q, \frac{\omega}{q})$

Γ

$\Gamma$

— caracal