Turunkan total (dalam kelas + antar kelas) matriks pencar


14

Saya mengutak-atik metode PCA dan LDA dan saya terjebak pada suatu titik, saya punya perasaan bahwa itu sangat sederhana sehingga saya tidak bisa melihatnya.

Matriks sebar dalam kelas ( SW ) dan antara kelas ( SB ) didefinisikan sebagai:

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

Matriks sebar total diberikan sebagai:ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

di mana C adalah jumlah kelas dan N adalah jumlah sampel adalah sampel, μ i adalah rerata kelas i, μxμiμ adalah rata-rata keseluruhan.

Ketika mencoba untuk menurunkan saya sampai pada titik di mana saya memiliki:ST

(xμi)(μiμ)T+(μiμ)(xμi)T

sebagai sebuah istilah. Ini harus nol, tetapi mengapa?


Memang:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]

2
Jawabannya adalah Anda menjumlahkan penyimpangan nilai di sekitar rata-rata dan jumlah itu nol. Tapi apa tepatnyax, m, dan msaya? Bagaimana kabarm dan msaya berhubungan dengan μ dan μsaya? Kualitas jawaban akan tergantung pada seberapa akurat kami menebak tetapi Anda memaksa kami untuk melakukan banyak tebakan!
whuber

@whuber: Anda benar sekali, saya merevisi pertanyaan saya.
nimcap

Jawaban:


8

Jika Anda menganggap

1Nt=1Nxtsaya=μsaya

Kemudian

saya=1Ct=1N(xtsaya-μsaya)(μsaya-μ)T=saya=1C(t=1N(xtsaya-μsaya))(μsaya-μ)T=0

dan formula berlaku. Anda menangani istilah kedua dengan cara yang sama.


2
(+1) Istilah kedua, sebagai transposisi dari yang pertama, juga harus nol :-).
whuber

@whuber, yes, that too :)
mpiktas

Hi,i don't get why the assumption holds?Can someone explain that?
Mvkt

1
@Mvkt It is not so much an assumption as the definition of μi I suppose. That is to say: μi is the mean of the observations in group i. I expect the answer uses 'assume' because the OP doesn't explain the notation, so we have to guess that the group mean is meant by μi.
Vincent
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.