Jika saya memiliki sampel iid multivariat normal , dan tentukan (yang merupakan semacam jarak Mahalanobis [kuadrat] dari titik sampel ke vektor menggunakan matriks untuk menentukan bobot), berapakah distribusi (jarak Mahalanobis ke sampel mean menggunakan sampel kovarians matriks )?d 2 i ( b , A ) = ( X i - b ) ′ A - 1 ( X i - b ) a A d 2 i ( ˉ X , S ) ˉ X S
Saya melihat sebuah makalah yang mengklaim itu adalah , tapi ini jelas salah: akan diperoleh untuk menggunakan vektor mean populasi (tidak diketahui) rata-rata dan matriks kovarians. Ketika analog sampel dicolokkan, seseorang harus mendapatkan distribusi Hotelling , atau distribusi berskala , atau sesuatu seperti itu, tetapi bukan . Saya tidak dapat menemukan hasil yang pasti di Muirhead (2005) , atau di Anderson (2003) , atau di Mardia, Kent dan Bibby (1979, 2003). Rupanya, orang-orang ini tidak repot dengan diagnosa outlier, karena distribusi normal multivariat sempurna dan mudah diperoleh setiap kali seseorang mengumpulkan data multivarian: - /.
Segalanya mungkin lebih rumit dari itu. Hasil distribusi Hotelling didasarkan pada asumsi independensi antara bagian vektor dan bagian matriks; kemerdekaan seperti berlaku untuk dan , tetapi tidak lagi berlaku untuk dan .