Menghasilkan nilai dari distribusi Gaussian multivarian

Saat ini saya mencoba untuk nilai-nilai simulasi dari berdimensi variabel acak yang memiliki distribusi normal multivariat dengan mean vector dan kovarians matriks . $N$ $X$ $\mu = (\mu_1,...,\mu_N)^T$ $S$

Saya berharap untuk menggunakan prosedur yang sama dengan metode inverse CDF, yang berarti bahwa saya ingin pertama menghasilkan berdimensi seragam variabel acak dan kemudian steker yang ke CDF kebalikan dari distribusi ini, sehingga untuk menghasilkan nilai . $N$ $U$ $X$

Saya mengalami masalah karena prosedurnya tidak didokumentasikan dengan baik dan ada sedikit perbedaan antara fungsi mvnrnd di MATLAB dan deskripsi yang saya temukan di Wikipedia .

Dalam kasus saya, saya juga memilih parameter distribusi secara acak. Secara khusus, saya menghasilkan masing-masing cara, , dari distribusi seragam . Saya kemudian membuat matriks kovarians menggunakan prosedur berikut: $\mu_i$ $U(20,40)$ $S$

Buat matriks segitiga lebih rendah di mana untuk dan untuk $L$ $L(i,i) = 1$ $i=1..N$ $L(i,j) = U(-1,1)$ $i < j$
Biarkan di mana menunjukkan transpos dari . $S = LL^T$ $L^T$ $L$

Prosedur ini memungkinkan saya untuk memastikan bahwa simetris dan pasti positif. Ini juga menyediakan matriks segitiga lebih rendah sehingga , yang saya percaya diperlukan untuk menghasilkan nilai dari distribusi. $S$ $L$ $S = LL^T$

Menggunakan pedoman di Wikipedia, saya harus dapat menghasilkan nilai-nilai menggunakan seragam dimensi sebagai berikut: $X$ $N$

$X = \mu + L * \Phi^{-1}(U)$

Menurut fungsi MATLAB, ini biasanya dilakukan sebagai:

$X = \mu + L^T * \Phi^{-1}(U)$

Dimana adalah CDF terbalik dari berdimensi, dipisahkan, distribusi normal, dan satu-satunya perbedaan antara kedua metode hanyalah apakah penggunaan atau . $\Phi^{-1}$ $N$ $L$ $L^T$

Apakah MATLAB atau Wikipedia adalah jalan yang harus ditempuh? Atau keduanya salah?

— Berk U.
sumber

Seperti yang dinyatakan, keduanya salah karena

adalah vektor baris sedangkan

harus menjadi vektor kolom. Saat baris dan kolom Anda diluruskan, pertanyaan ini harus menjawab sendiri hanya dengan mengidentifikasi versi

atau

μ

$\mu$

T * i n v n o r m (U)

$T * invnorm(U)$

(X - μ)^{'} (X - μ)

$(X-\mu)'(X-\mu)$

(X - μ) (X - μ)^{'}

$(X-\mu)(X-\mu)'$ memberikan matriks dan versi memberikan hanya nomor: cek bahwa Anda dapat menghitung harapan versi matriks dan memberikan

S

$S$

— whuber

@whuber Yeap. Membuat perubahan pada format untuk pertanyaan. Terima kasih atas tipnya - jelas cara termudah untuk memeriksa.

— Berk U.

Jika adalah vektor kolom dari standar yang normal RV, maka jika Anda menetapkan , kovarians dari adalah . $X \sim \mathcal{N}(0,I)$ $Y = L X$ $Y$ $L L^T$

Saya pikir masalah yang Anda hadapi mungkin timbul dari fakta bahwa fungsi mvnrnd matlab mengembalikan vektor baris sebagai sampel, bahkan jika Anda menentukan rata-rata sebagai vektor kolom. misalnya,

 > size(mvnrnd(ones(10,1),eye(10))  
 > ans =
 >      1    10

Dan perhatikan bahwa mengubah vektor baris memberi Anda formula yang berlawanan. jika adalah vektor baris, maka juga merupakan vektor baris, sehingga adalah vektor kolom, dan kovarians dari dapat ditulis . $X$ $Z = X L^T$ $Z^T = L X^T$ $Z^T$ $E[Z^TZ] = LL^T$

Berdasarkan apa yang Anda tulis meskipun, rumus Wikipedia benar: jika adalah vektor baris dikembalikan oleh matlab, Anda tidak bisa meninggalkan-kalikan dengan . (Tapi benar-mengalikannya dengan akan memberikan contoh dengan kovarians yang sama ). $\Phi^{-1}(U)$ $L^T$ $L^T$ $LL^T$

— jpillow
sumber

Perhatikan bahwa bantuan untuk mvnrnd di matlab menggunakan

sebagai jumlah sampel; jumlah dimensi adalah

. Jadi jika Anda meminta sampel

dari normal multivarian

dimensional, mengembalikannya sebagai matriks

N

$N$

D

$D$

N

$N$

D

$D$

N \times D

$N \times D$

— jpillow