Fenomena khusus yang Anda lihat dengan solusi kuadrat terkecil dalam Uskup Gambar 4.5 adalah fenomena yang hanya terjadi ketika jumlah kelas adalah .≥ 3
Dalam ESL , Gambar 4.2 di halaman 105, fenomena ini disebut masking . Lihat juga ESL Gambar 4.3. Solusi kuadrat terkecil menghasilkan prediktor untuk kelas middel yang sebagian besar didominasi oleh prediktor untuk dua kelas lainnya. LDA atau regresi logistik tidak menderita masalah ini. Orang dapat mengatakan bahwa itu adalah struktur kaku dari model linear probabilitas kelas (yang pada dasarnya adalah apa yang Anda dapatkan dari kuadrat terkecil yang cocok) yang menyebabkan penyamaran.
Dengan hanya dua kelas, fenomena tersebut tidak terjadi lihat juga Latihan 4.2 dalam ESL, halaman 135, untuk perincian tentang hubungan antara solusi LDA dan solusi kuadrat terkecil dalam kasus dua kelas.-
Sunting: Masking mungkin paling mudah divisualisasikan untuk masalah dua dimensi, tetapi juga masalah dalam kasus satu dimensi, dan di sini matematika sangat mudah dimengerti. Misalkan variabel input satu dimensi dipesan sebagai
x1< ... < xk< y1< ... ym< z1< ... < zn
dengan 's dari kelas 1, 's dari kelas dua dan 's dari kelas 3. Bersama-sama dengan skema pengkodean untuk kelas sebagai vektor biner tiga dimensi kita memiliki data yang disusun sebagai berikutxyz
TTxT100x1............100xk010y1............010ym001z1............001zn
Solusi kuadrat terkecil diberikan sebagai tiga regresi dari masing-masing kolom di pada . Untuk kolom pertama, kelas- , kemiringan akan negatif (semua yang berada di sebelah kiri di atas) dan untuk kolom terakhir, kelas- , kemiringan akan positif. Untuk kolom tengah,Txxzy-kelas, regresi linier harus menyeimbangkan nol untuk dua kelas luar dengan yang di kelas menengah menghasilkan garis regresi yang agak datar dan kesesuaian yang buruk dari probabilitas kelas kondisional untuk kelas ini. Ternyata, maks garis regresi untuk dua kelas luar mendominasi garis regresi untuk kelas menengah untuk sebagian besar nilai variabel input, dan kelas menengah ditutupi oleh kelas luar.
Bahkan, jika maka satu kelas akan selalu tertutup sepenuhnya, terlepas dari apakah variabel input dipesan seperti di atas. Jika ukuran kelas semua sama dengan tiga garis regresi semua melewati titik mana
Oleh karena itu, ketiga garis semuanya berpotongan di titik yang sama dan maks dua di antaranya mendominasi yang ketiga.k = m = n( x¯, 1 / 3 )
x¯= 13 k( x1+ ... + xk+ y1+ ... + ym+ z1+ ... + zn) .