Mengapa matriks kovarians sampel tunggal ketika ukuran sampel kurang dari jumlah variabel?


30

Katakanlah saya memiliki distribusi Gaussian multivariat dimensional. Dan saya mengambil pengamatan (masing-masing satu -vector) dari distribusi ini dan menghitung sampel kovarians matriks . Dalam hal ini kertas , negara penulis bahwa matriks kovarians sampel dihitung dengan adalah tunggal.halnhalShal>n

  • Bagaimana itu benar atau diturunkan?
  • Ada penjelasan?

4
Perhatikan bahwa ini benar-benar independen dari distribusi yang mendasarinya: tidak perlu menjadi Gauss.
Amoeba berkata Reinstate Monica

Jawaban:


22

Beberapa fakta tentang peringkat matriks, ditawarkan tanpa bukti (tetapi bukti dari semua atau hampir semuanya harus diberikan dalam teks aljabar linier standar, atau dalam beberapa kasus ditetapkan sebagai latihan setelah memberikan informasi yang cukup untuk dapat melakukannya):

Jika dan adalah dua matriks yang sesuai, maka:SEBUAHB

(i) peringkat kolom = peringkat barisSEBUAHSEBUAH

(ii)pangkat(SEBUAH)=pangkat(SEBUAHT)=pangkat(SEBUAHTSEBUAH)=pangkat(SEBUAHSEBUAHT)

(iii)pangkat(SEBUAHB)min(pangkat(SEBUAH),pangkat(B))

(iv) pangkat(SEBUAH+B)pangkat(SEBUAH)+pangkat(B)

(v) jika B adalah matriks kuadrat dari peringkat penuh, maka pangkat(SEBUAHB)=pangkat(SEBUAH)

Pertimbangkan n×hal matriks data sampel, y . Dari yang di atas, pangkat y paling banyak min(n,hal) .

Lebih jauh, dari yang di atas jelas peringkat tidak akan lebih besar dari peringkat (dengan mempertimbangkan perhitungan dalam bentuk matriks, dengan mungkin beberapa penyederhanaan).y SSyS

Jika maka dalam hal ini .peringkat ( y ) < p peringkat ( S ) < pn<halpangkat(y)<halpangkat(S)<hal


jawaban bagus! Namun tidak sepenuhnya jelas bagaimana y dan S berhubungan dengan A dan B?
Matifou

S dihitung dari y; ("x" di posting asli). Anda dapat menggunakan fakta tentang y dan manipulasi yang dilakukan di atasnya (melalui aturan di atas) untuk membuat ikatan pada peringkat S. Peran yang dimainkan oleh A dan B berubah dari langkah ke langkah.
Glen_b -Reinstate Monica

14

Jawaban singkat untuk pertanyaan Anda adalah peringkat . Jadi jika , maka adalah singular.p > n S(S)n1p>nS

Untuk jawaban yang lebih terperinci, ingat bahwa matriks kovarians sampel (tidak bias) dapat ditulis sebagai

S=1n1i=1n(xix¯)(xix¯)T.

Secara efektif, kami menjumlahkan matriks, masing-masing memiliki pangkat 1. Dengan asumsi pengamatan independen secara linear, dalam beberapa hal setiap pengamatan berkontribusi 1 ke peringkat , dan 1 dikurangkan dari peringkat (jika ) karena kami memusatkan setiap pengamatan dengan . Namun, jika multikolinearitas hadir dalam pengamatan, maka peringkat dapat dikurangi, yang menjelaskan mengapa peringkat tersebut mungkin kurang dari .x i ( S ) p > n ˉ x ( S ) n - 1nxsaya(S)hal>nx¯(S)n-1

Sejumlah besar pekerjaan telah dilakukan untuk mempelajari masalah ini. Sebagai contoh, seorang kolega saya dan saya menulis makalah tentang topik yang sama, di mana kami tertarik untuk menentukan bagaimana melanjutkan jika adalah tunggal ketika diterapkan pada analisis diskriminan linier dalam pengaturan .p nShaln


4
Bisakah Anda menjelaskan mengapa mengurangi 1 karena kami memusatkan setiap pengamatan dengan x¯ ?
alpukat


Jawaban bagus! Mungkin bisa menambahkan penjelasan / tautan untuk fakta pernyataan yang kami simpulkan 𝑛 matriks, masing-masing memiliki peringkat 1 ? Terima kasih!
Matifou

10

Ketika Anda melihat situasi dengan cara yang benar, kesimpulan secara intuitif jelas dan langsung.

Posting ini menawarkan dua demonstrasi. Yang pertama, tepat di bawah, adalah dalam kata-kata. Ini setara dengan gambar sederhana, muncul di bagian paling akhir. Di antaranya adalah penjelasan tentang apa arti kata-kata dan gambar.


Kovarians matriks untuk p pengamatan -variate adalah p × p matriks dihitung dengan kiri mengalikan matriks X n p (data recentered) oleh transposnya X ' p n . Produk matriks ini mengirimkan vektor melalui pipa ruang vektor di mana dimensi p dan n . Akibatnya matriks kovarians, qua transformasi linear, akan mengirim R n ke dalam ruang bagian yang dimensi adalah paling min ( p , n ) .n halhal×halXnhalXhalnhalnRnmin(hal,n)Langsung bahwa pangkat matriks kovarians tidak lebih besar dari . min(hal,n) Akibatnya, jika maka pangkatnya paling banyak n , yang - karena lebih kecil dari berarti matriks kovarians adalah singular.hal>nnhal

Semua terminologi ini sepenuhnya dijelaskan dalam sisa posting ini.

(Seperti yang Amoeba tunjukkan dengan ramah pada komentar yang sekarang dihapus, dan ditunjukkan dalam jawaban untuk pertanyaan terkait , gambar sebenarnya terletak pada codimension-one subruang dari (terdiri dari vektor yang komponen dijumlahkan ke nol) karena semua kolomnya telah dipusatkan kembali pada nol. Oleh karena itu pangkat matriks kovarian sampel tidak dapat melebihi )R n 1XRnn-11n1XXn1


Aljabar linier adalah semua tentang pelacakan dimensi ruang vektor. Anda hanya perlu menghargai beberapa konsep dasar untuk memiliki intuisi mendalam untuk pernyataan tentang pangkat dan singularitas:

  1. Perkalian matriks merupakan transformasi linear dari vektor. Sebuah matriks merupakan transformasi linear dari berdimensi ruang ke berdimensi ruang . Secara khusus, ia mengirimkan ke . Bahwa ini adalah transformasi linear segera mengikuti dari definisi transformasi linear dan sifat-sifat dasar aritmatika perkalian matriks.M n V n m V m x V n M x = y V mm×nMnVnmVmxVnMx=yVm

  2. Transformasi linier tidak pernah dapat meningkatkan dimensi. Ini berarti bahwa citra seluruh ruang vektor di bawah transformasi M (yang merupakan ruang sub-vektor dari V m ) dapat memiliki dimensi tidak lebih besar dari n . Ini adalah teorema (mudah) yang mengikuti dari definisi dimensi.VnMVmn

  3. Dimensi ruang sub-vektor tidak dapat melebihi ruang di mana ia berada. Ini adalah teorema, tetapi sekali lagi jelas dan mudah dibuktikan.

  4. The rank dari transformasi linear adalah dimensi citra. Pangkat matriks adalah pangkat transformasi linear yang diwakilinya. Ini adalah definisi.

  5. Sebuah singular matriks memiliki peringkat ketat kurang dari nMmnn (dimensi domainnya). Dengan kata lain, citranya memiliki dimensi yang lebih kecil. Ini adalah definisi.

Untuk mengembangkan intuisi, ada baiknya melihat dimensi. Oleh karena itu saya akan menulis dimensi semua vektor dan matriks segera setelah mereka, seperti dalam dan x n . Demikianlah rumus generiknyaMmnxn

ym=Mmnxn

dimaksudkan untuk berarti bahwa matriks M , bila diterapkan pada n -vector x , menghasilkan m -vector y .m×nMnxmy

Produk dari matriks dapat dianggap sebagai "pipa" dari transformasi linear. Umum, misalkan merupakan sebuah vektor berdimensi yang dihasilkan dari aplikasi berturut-turut dari linear transformasi M m n , L l m , ... , B b c , dan A sebuah b ke n -vector x n yang datang dari ruang V n . Ini mengambil vektor x n secara berurutan melalui seperangkat ruang vektor dimensi myaaMmn,Llm,,Bbc,SEBUAHSebuahbnxnVnxn dan akhirnya a .m,l,...,c,b,Sebuah

Cari bottleneck : karena dimensi tidak dapat meningkat (titik 2) dan subruang tidak dapat memiliki dimensi lebih besar dari ruang di mana mereka berada (titik 3), maka dimensi gambar tidak dapat melebihi dimensi terkecil min ( a , b , c , ... , l , m , n ) ditemui di dalam pipa.Vnmin(Sebuah,b,c,...,l,m,n)


Diagram pipa ini, kemudian, sepenuhnya membuktikan hasilnya ketika diterapkan pada produk :XX

! [masukkan deskripsi gambar di sini

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.