Ada dua situasi khas yang berbeda untuk masalah seperti ini:
i) Anda ingin menghasilkan sampel dari distribusi tertentu yang karakteristik populasinya cocok dengan yang ditentukan (tetapi karena variasi pengambilan sampel, Anda tidak memiliki karakteristik sampel yang sama persis).
ii) Anda ingin menghasilkan sampel yang karakteristik sampelnya cocok dengan yang ditentukan (tetapi, karena kendala pencocokan jumlah sampel dengan sekumpulan nilai yang ditentukan sebelumnya, tidak benar-benar berasal dari distribusi yang Anda inginkan).
Anda menginginkan case kedua - tetapi Anda mendapatkannya dengan mengikuti pendekatan yang sama dengan case pertama, dengan langkah standardisasi tambahan.
Jadi untuk normals multivariat, dapat dilakukan dengan cara yang cukup mudah:
Dengan case pertama Anda dapat menggunakan normals acak tanpa struktur populasi (seperti standar normal iid yang memiliki harapan 0 dan matriks kovarian identitas) dan kemudian memaksakannya - mentransformasikannya untuk mendapatkan matriks kovarians dan berarti yang Anda inginkan. Jika dan adalah rata-rata populasi dan kovarian yang Anda butuhkan dan adalah standar normal, Anda menghitung , untuk beberapa mana (misalnya sesuai dapat diperoleh melalui dekomposisi Cholesky) . Maka memiliki karakteristik populasi yang diinginkan.Σ z y = L z + μ L L L ' = Σ LμΣzy= L z+ μL.LL′=ΣLy
Dengan yang kedua, Anda harus terlebih dahulu mengubah normals acak Anda untuk menghapus bahkan variasi acak menjauh dari mean nol dan kovarian identitas (membuat sampel berarti nol dan sampel kovarian ), kemudian melanjutkan seperti sebelumnya. Tapi itu langkah awal menghapus deviasi sampel dari mean tepat , varian mengganggu distribusi. (Dalam sampel kecil itu bisa sangat parah.) 0 IIn0I
Ini dapat dilakukan dengan mengurangi mean sampel dari ( ) dan menghitung dekomposisi Cholesky dari . Jika adalah faktor Cholesky kiri, maka harus memiliki mean sampel 0 dan kovarians sampel identitas. Anda kemudian dapat menghitung dan memiliki sampel dengan momen sampel yang diinginkan. (Tergantung pada bagaimana jumlah sampel Anda didefinisikan, mungkin ada biola kecil ekstra yang terlibat dengan mengalikan / membagi dengan faktor-faktor seperti , tetapi cukup mudah untuk mengidentifikasi kebutuhan itu.)z ∗ = z - ˉ z z ∗ L ∗ z ( 0 ) = ( L ∗ ) - 1 z ∗ y = L z ( 0 ) + μ √zz∗=z−z¯z∗L∗z(0)=(L∗)−1z∗y=Lz(0)+μn−1n−−−√