Estimator yang tidak bias dari matriks kovarian sampel yang diberikan n titik data xi∈Rd adalah mana ˉ x =∑xi/nadalah rata-rata di semua titik. Marilah kita menyatakan(xi- ˉ x )sebagaizi. The1
C=1n−1∑i=1n(xi−x¯)(xi−x¯)⊤,
x¯=∑xi/n(xi−x¯)ziFaktor
n - 1 tidak mengubah peringkat, dan setiap istilah dalam jumlah memiliki (menurut definisi) peringkat
1, jadi inti dari pertanyaan adalah sebagai berikut:
1n−11
Mengapa memiliki peringkat n - 1 dan bukan peringkat n , seperti yang terlihat karena kita menjumlahkan matriks n peringkat- 1 ?∑ziz⊤in−1nn1
Jawabannya adalah itu terjadi karena tidak independen. Dengan konstruksi, ∑ z i = 0 . Jadi, jika Anda tahu n - 1 dari z i , maka z n yang tersisa sepenuhnya ditentukan; kita tidak menjumlahkan n independen Rank 1 matriks, kita menjumlahkan hanya n - 1 independen Rank 1 matriks dan kemudian menambahkan satu lagi Rank 1 matriks yang sepenuhnya linear ditentukan oleh sisanya. Penambahan terakhir ini tidak mengubah peringkat keseluruhan.zi∑zi=0n−1ziznn1n−111
Kita bisa melihat ini secara langsung jika kita menulis ulang sebagai z n = - n - 1 Σ i = 1 z i , dan sekarang hubungkan ke ekspresi di atas: n Σ i = 1 z i z ⊤ i = n - 1 ∑ i = 1 z i z ⊤ i + ( - n - 1 ∑ i = 1∑zi=0
zn=−∑i=1n−1zi,
Sekarang hanya ada n - 1 istilah yang tersisa di penjumlahan dan menjadi jelas bahwa seluruh jumlah dapat memiliki paling banyak peringkat n - 1 .∑i=1nziz⊤i=∑i=1n−1ziz⊤i+(−∑i=1n−1zi)z⊤n=∑i=1n−1zi(zi−zn)⊤.
n−1n−1
Hasil ini, omong-omong, mengisyaratkan mengapa faktor dalam penaksir kovarians yang tidak memihak adalah dan bukan11n−1 .1n
Intuisi geometris yang saya singgung dalam komentar di atas adalah bahwa seseorang dapat selalu cocok dengan garis 1D untuk dua titik dalam 2D dan satu selalu dapat memasukkan bidang 2D ke tiga titik dalam 3D, yaitu dimensi subruang selalu ; ini hanya berfungsi karena kami menganggap bahwa garis ini (dan bidang) dapat "bergerak" agar sesuai dengan poin kami. "Memposisikan" garis ini (atau bidang) sedemikian sehingga melewati ˉ x setara dengan berpusat pada argumen aljabar di atas.n−1x¯