Dalam R
, saya menggunakan lda
fungsi dari perpustakaan MASS
untuk melakukan klasifikasi. Seperti yang saya mengerti LDA, input akan diberi label , yang memaksimalkan , kan?
Tapi ketika saya cocok dengan model, di mana lda
,
Edit: untuk mereproduksi output di bawah ini, jalankan pertama:
library(MASS)
library(ISLR)
train = subset(Smarket, Year < 2005)
lda.fit = lda(Direction ~ Lag1 + Lag2, data = train)
> lda.fit Call: lda(Direction ~ Lag1 + Lag2, data = train) Prior probabilities of groups: Down Up 0.491984 0.508016 Group means: Lag1 Lag2 Down 0.04279022 0.03389409 Up -0.03954635 -0.03132544 Coefficients of linear discriminants: LD1 Lag1 -0.6420190 Lag2 -0.5135293
Saya mengerti semua info di output di atas tetapi satu hal, apa LD1
? Saya mencari web untuk itu, apakah itu skor diskriminan linier ? Apa itu dan mengapa saya membutuhkannya?
MEMPERBARUI
Saya membaca beberapa posting (seperti ini dan ini ) dan juga mencari DA di web, dan sekarang inilah yang saya pikirkan tentang DA atau LDA.
Ini dapat digunakan untuk melakukan klasifikasi, dan ketika ini tujuannya, saya dapat menggunakan pendekatan Bayes, yaitu, menghitung posterior ( y | x ) untuk setiap kelas , dan kemudian mengklasifikasikan ke kelas dengan yang tertinggi belakang. Dengan pendekatan ini, saya tidak perlu menemukan diskriminasi sama sekali, kan?
Seperti yang saya baca di posting, DA atau setidaknya LDA terutama ditujukan untuk pengurangan dimensionalitas , untuk kelas dan ruang prediktor dim, saya dapat memproyeksikan -dim ke dalam ruang fitur baru -dim , itu adalah,
,dapat dilihat sebagai vektor fitur yang ditransformasi dariasli, dan setiapadalah vektor di mana diproyeksikan .
Apakah saya benar tentang pernyataan di atas? Jika ya, saya punya pertanyaan berikut:
Apa itu diskriminan ? Apakah setiap entri dalam vektor adalah diskriminan? Atau ?
Bagaimana cara klasifikasi menggunakan diskriminan?
discriminant analysis
di situs ini.