Istilah-istilah ini muncul di beberapa buku tentang statistik multivarian. Misalkan Anda memiliki n
individu dengan p
matriks data fitur kuantitatif. Kemudian Anda dapat memplot individu sebagai titik di ruang di mana sumbu adalah fitur. Itu akan menjadi scatterplot klasik, alias plot ruang variabel . Kita katakan, awan individu menjangkau ruang yang ditentukan oleh fitur sumbu.
Anda juga bisa membayangkan sebar dengan poin menjadi variabel dan sumbu adalah individu. Benar-benar seperti sebelumnya, hanya kocar-kacir. Itu akan menjadi plot ruang subjek (atau plot ruang observasi) dengan variabel yang membentangnya, individu yang mendefinisikannya.
n>p
p
n
p
p
1
Jika fitur (kolom dari matriks data) dipusatkan sebelum menggambar plot ruang subjek maka cosinus sudut antara vektor variabel sama dengan korelasi Pearson, sedangkan panjang vektor sama dengan norma variabel (jumlah akar kuadrat kotak) ) atau standar deviasi (jika dibagi dengan df ).
Ruang variabel dan ruang subjek adalah dua sisi dari koin yang sama, mereka adalah ruang analitik Euclidean yang sama , hanya disajikan seperti cermin satu sama lain. Mereka berbagi properti yang sama, seperti nilai eigen bukan nol dan vektor eigen. Karena itu dimungkinkan untuk memplot kedua subjek dan variabel secara berdampingan sebagai titik di ruang sumbu utama (atau basis ortogonal lainnya) dari ruang analitik tersebut, - plot gabungan ini disebut biplot . Saya tidak tahu persis apa yang dimaksud dengan "ruang data" - jika itu berarti sesuatu yang spesifik maka saya kira itu adalah ruang analitik umum di mana ruang subjek dan ruang variabel adalah dua hipotesa.
Beberapa tautan lokal:
- Gambar yang menunjukkan representasi ruang subjek dari komponen utama (PCA), regresi linier , dan analisis faktor , juga regresi . Bandingkan dengan representasi tradisional, ruang variabel (scatterplot) dari regresi dan PCA .
- Penjelasan teoritis tentang biplot . Satu studi mandiri menjelaskan struktur biplot di PCA .
- Lihat juga pos yang mencoba mencari tahu apakah seseorang dapat secara geometris menyelesaikan tugas PCA pada plot ruang subjek (tampak bahwa PC menentukan elips; tetapi bagaimana menemukan elips unik itu?).
1n=5
p=2