Ini adalah tiga metode yang berbeda, dan tidak satupun dari mereka dapat dilihat sebagai kasus khusus dari yang lain.
Secara formal, jika dan Y yang berpusat prediktor ( n × p ) dan respon ( n × q ) dataset dan jika kita mencari pasangan pertama dari sumbu, w ∈ R p untuk X dan v ∈ R q untuk Y , maka metode ini maksimalkan jumlah berikut:XYn×pn×qw∈RpXv∈RqY
PCA:RRR:PLS:CCA:Var(Xw)Var(Xw)⋅Corr2(Xw,Yv)⋅Var(Yv)Var(Xw)⋅Corr2(Xw,Yv)⋅Var(Yv)=Cov2(Xw,Yv)Var(Xw)⋅Corr2(Xw,Yv)
(Saya menambahkan analisis korelasi kanonik ke dalam daftar ini.)
Saya menduga bahwa kebingungan mungkin karena di SAS ketiga metode tampaknya diimplementasikan melalui fungsi yang sama PROC PLS
dengan parameter yang berbeda. Jadi mungkin tampak bahwa ketiga metode adalah kasus khusus PLS karena itulah fungsi SAS dinamai. Namun, ini hanya penamaan yang tidak menguntungkan. Pada kenyataannya, PLS, RRR, dan PCR adalah tiga metode berbeda yang kebetulan diimplementasikan dalam SAS dalam satu fungsi yang karena alasan tertentu disebut PLS
.
Kedua tutorial yang Anda tautkan sebenarnya sangat jelas tentang hal itu. Halaman 6 dari presentasi tutorial menyatakan tujuan dari ketiga metode dan tidak mengatakan PLS "menjadi" RRR atau PCR, bertentangan dengan apa yang Anda klaim dalam pertanyaan Anda. Demikian pula, dokumentasi SAS menjelaskan bahwa tiga metode berbeda, memberikan rumus dan intuisi:
[P] komponen rincipal regresi memilih faktor-faktor yang menjelaskan variasi prediktor sebanyak mungkin, regresi peringkat yang dikurangi memilih faktor-faktor yang menjelaskan sebanyak mungkin variasi respons, dan kuadrat terkecil parsial menyeimbangkan kedua tujuan, mencari faktor-faktor yang menjelaskan variasi respons dan prediksi. .
x1x2yXyX
Seseorang dapat menambahkan penalti punggungan ke fungsi RRR yang hilang untuk mendapatkan regresi pangkat rendah ridge, atau RRRR. Ini akan menarik sumbu regresi ke arah PC1, agak mirip dengan apa yang dilakukan PLS. Namun, fungsi biaya untuk RRRR tidak dapat ditulis dalam bentuk PLS, sehingga mereka tetap berbeda.
y