Mengapa jejak


13

Dalam model y=Xβ+ϵ , kita dapat memperkirakan β menggunakan persamaan normal :

β^=(XX)1Xy,
dan kita bisa mendapatkan y =X β .
y^=Xβ^.

Vektor residu diperkirakan oleh

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ,

di mana

Q=IX(XX)1X.

Pertanyaan saya adalah bagaimana cara mendapatkan kesimpulan dari

tr(Q)=np.

Jawaban:


12

Kesimpulannya hanya menghitung dimensi ruang vektor. Namun, itu umumnya tidak benar.

Sifat yang paling dasar perkalian matriks menunjukkan bahwa transformasi linear diwakili oleh matriks memenuhiH=X(XX)X

H2=(X(XX)X)2=X(XX)(XX)(XX)X=H,

memamerkannya sebagai operator proyeksi . Karena itu pelengkapnya

Q=1H

(seperti yang diberikan dalam pertanyaan) juga merupakan operator proyeksi. Jejak adalah peringkatnya h (lihat di bawah), di mana jejak Q sama dengan n - h .HhQnh

Dari rumusnya, jelaslah bahwa adalah matriks yang terkait dengan komposisi dua transformasi linier J = ( X X ) - X dan X itu sendiri. Pertama ( J ) mengubah n -vector y ke p -vector β . Kedua ( X ) adalah transformasi dari R p ke R n diberikan oleh y = X βH

J=(XX)X
XJnypβ^XRpRny^=Xβ^. Peringkatnya tidak dapat melebihi yang lebih kecil dari dua dimensi itu, yang dalam pengaturan kuadrat terkecil selalu (tetapi bisa kurang dari p , setiap kali J tidak dari peringkat penuh). Akibatnya pangkat komposisi H = X J tidak dapat melebihi pangkat X . Maka kesimpulan yang benar adalahppJH=XJX

jika dan hanya jika J adalah peringkat penuh; dan secara umum n tr ( Q ) n - p . Dalam kasus sebelumnya model dikatakan "dapat diidentifikasi" (untuk koefisien β ).tr(Q)=npJntr(Q)npβ

akan memiliki peringkat penuh jika dan hanya jika X X tidak dapat dibalik.JXX


Interpretasi geometris

mewakili proyeksi ortogonal dari n- vektor y (mewakili "respon" atau "variabel dependen") ke ruang yang dibentangkan oleh kolom X (mewakili "variabel independen" atau "kovariat"). Perbedaan Q = 1 - H menunjukkan cara menguraikan setiap n- vektor y menjadi jumlah vektor y = H ( y ) + Q ( y ) , di mana yang pertama dapat "diprediksi" dari X dan yang kedua tegak lurus terhadapnya . Saat halHnyXQ=1Hny

y=H(y)+Q(y),
Xp kolom menghasilkan p- dimensi ruang (yaitu, tidak collinear), pangkat HXpH adalah dan pangkat Q adalah n - p , yang mencerminkan dimensi tambahan variasi n - p dalam respons yang tidak terwakili dalam variabel independen. Jejak memberikan rumus aljabar untuk dimensi ini.pQnpnp

Latar Belakang Aljabar Linier

Sebuah operator proyeksi pada ruang vektor (seperti R n ) adalah transformasi linear P : V V (yaitu, endomorfisma dari VVRnP:VVV ) sehingga . Ini menjadikan pelengkapnya Q = 1 - P sebagai operator proyeksi juga, karenaP2=PQ=1P

Q2=(1P)2=12P+P2=12P+P=Q.

Semua proyeksi memperbaiki setiap elemen gambar mereka, untuk setiap kali kita dapat menulis v = P ( w ) untuk beberapa w V , di mana w = P ( v ) = P 2 ( v ) = P ( P ( v ) ) = P ( w ) .vIm(P)v=P(w)wV

w=P(v)=P2(v)=P(P(v))=P(w).

Terkait dengan endomorfisma dari V adalah dua subruang: nya kernel ker ( PPV dangambarnya Im ( P ) = { v v

ker(P)={vv|P(v)=0}
Setiap vektor v V dapat ditulis dalam bentuk v = w + u di mana w Im ( P ) dan u Ker ( P ) . Karena itu kita dapat membangun basis E F untuk V yang E Ker ( P ) dan F Im
Im(P)={vv|wVP(w)=v}.
vV
v=w+u
wIm(P)uKer(P)EFVEKer(P) . Ketika V adalah dimensi-terbatas, maka matriks P pada basis ini akan berada dalam bentuk blok-diagonal, dengan satu blok (sesuai dengan aksi P pada E ) semua nol dan yang lainnya (sesuai dengan aksi P pada F ) samadenganmatriks f oleh f , di mana dimensi F adalah f . Jejak P adalah jumlah dari nilai-nilai pada diagonal dan karenanya harus sama dengan f × 1 = f . Angka ini adalahpangkatdariFIm(P)VPPEPFffFfPf×1=fP

Jejak sama dengan jejak 1 (sama dengan n , dimensi V ) dikurangi jejak1P1nVP

Hasil-hasil ini dapat dirangkum dengan pernyataan bahwa jejak proyeksi sama dengan peringkatnya.


Terima kasih banyak. Saya belajar banyak pengetahuan dari jawaban Anda.
zhushun0008

19

@Dougal has already given an answer, but here is another one, a bit simpler.

First, let's use the fact that tr(AB)=tr(A)tr(B). So, we get:

tr(Q)=tr(I)tr(X(XX)1X).
Now I is an n×n identity matrix, so tr(I)=n. Now let's use the fact that tr(AB)=tr(BA), that is, the trace is invariant under cyclic permutations. So, we have:
tr(Q)=ntr((XX)1(XX)).
When we multiply (XX)1 with (XX), we get a p×p identity matrix, whose trace is p. So, we get:
tr(Q)=np.

6

Assume that np and that X is full-rank.

Consider the compact singular value decomposition X=UΣVT, where ΣRp×p is diagonal and URn×p,VRp×p have UTU=VTV=VVT=Ip (but note UUT is rank at most p so it cannot be In). Then

X(XTX)1XT=UΣVT(VΣUTUΣVT)1VΣUT=UΣVT(VΣ2VT)1VΣUT=UΣVTVΣ2VTVΣUT=UUT.

Now, there exists a matrix U2Rn×np such that Un=[UU2] is unitary. We can write

IX(XTX)1XT=UnUnTUUT=Un(In[Ip000])UnT=Un[000Inp]UnT.
This form shows that Q is positive semidefinite, and since it is a valid svd and the singular values are the square of the eigenvalues for a square symmetric matrix, also tells us that Q has eigenvalues 1 (of multiplicity np) and 0 (of multiplicity p). Thus the trace of Q is np.
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.