Saya mengutak-atik metode PCA dan LDA dan saya terjebak pada suatu titik, saya punya perasaan bahwa itu sangat sederhana sehingga saya tidak bisa melihatnya.
Matriks sebar dalam kelas ( ) dan antara kelas ( ) didefinisikan sebagai:
Matriks sebar total diberikan sebagai:
di mana C adalah jumlah kelas dan N adalah jumlah sampel adalah sampel, μ i adalah rerata kelas i, μ adalah rata-rata keseluruhan.
Ketika mencoba untuk menurunkan saya sampai pada titik di mana saya memiliki:
sebagai sebuah istilah. Ini harus nol, tetapi mengapa?
Memang:
2
Jawabannya adalah Anda menjumlahkan penyimpangan nilai di sekitar rata-rata dan jumlah itu nol. Tapi apa tepatnya
—
whuber
, , dan ? Bagaimana kabar dan berhubungan dengan dan ? Kualitas jawaban akan tergantung pada seberapa akurat kami menebak tetapi Anda memaksa kami untuk melakukan banyak tebakan!
@whuber: Anda benar sekali, saya merevisi pertanyaan saya.
—
nimcap