Sementara "Elemen Pembelajaran Statistik" adalah buku yang brilian, ia membutuhkan tingkat pengetahuan yang relatif tinggi untuk mendapatkan yang terbaik darinya. Ada banyak sumber daya lain di web untuk membantu Anda memahami topik dalam buku ini.
Mari kita ambil contoh yang sangat sederhana dari analisis diskriminan linier di mana Anda ingin mengelompokkan satu set titik data dua dimensi ke dalam K = 2 kelompok. Penurunan dimensi hanya akan menjadi K-1 = 2-1 = 1. Seperti yang dijelaskan @deinst, penurunan dimensi dapat dijelaskan dengan geometri elementer.
Dua titik dalam dimensi apa pun dapat digabungkan dengan garis, dan garis adalah satu dimensi. Ini adalah contoh dari K-1 = 2-1 = 1 ruang bagian dimensi.
Sekarang, dalam contoh sederhana ini, himpunan titik data akan tersebar dalam ruang dua dimensi. Poin akan diwakili oleh (x, y), jadi misalnya Anda bisa memiliki titik data seperti (1,2), (2,1), (9,10), (13,13). Sekarang, menggunakan analisis diskriminan linier untuk membuat dua grup A dan B akan menghasilkan titik data yang diklasifikasikan sebagai milik grup A atau ke grup B sehingga properti tertentu terpenuhi. Analisis diskriminan linier mencoba untuk memaksimalkan varians antara kelompok dibandingkan dengan varians dalam kelompok.
Dengan kata lain, grup A dan B akan berjauhan dan berisi titik data yang berdekatan. Dalam contoh sederhana ini, jelas bahwa poin akan dikelompokkan sebagai berikut. Grup A = {(1,2), (2,1)} dan Grup B = {(9,10), (13,13)}.
Sekarang, centroid dihitung sebagai centroid dari kelompok-kelompok titik data demikian
Centroid of group A = ((1+2)/2, (2+1)/2) = (1.5,1.5)
Centroid of group B = ((9+13)/2, (10+13)/2) = (11,11.5)
Centroid hanya 2 poin dan menjangkau garis 1 dimensi yang menggabungkannya.
Anda dapat menganggap analisis diskriminan linier sebagai proyeksi titik data pada suatu garis sehingga kedua kelompok titik data tersebut "terpisah mungkin"
Jika Anda memiliki tiga grup (dan mengatakan tiga titik data dimensional) maka Anda akan mendapatkan tiga centroid, cukup tiga poin, dan tiga poin dalam ruang 3D menentukan bidang dua dimensi. Sekali lagi aturan K-1 = 3-1 = 2 dimensi.
Saya sarankan Anda mencari sumber daya di web yang akan membantu menjelaskan dan memperluas pengenalan sederhana yang saya berikan; misalnya http://www.music.mcgill.ca/~ich/classes/mumt611_07/classifiers/lda_theory.pdf