Tampak bagi saya bahwa fungsi utama PCP adalah untuk menyoroti kelompok-kelompok individu yang homogen, atau sebaliknya (dalam ruang ganda, dengan analogi dengan PCA) pola-pola asosiasi spesifik pada variabel yang berbeda. Ini menghasilkan ringkasan grafis yang efektif dari kumpulan data multivarian, ketika tidak ada terlalu banyak variabel. Variabel secara otomatis diskalakan ke rentang tetap (biasanya, 0-1) yang setara dengan bekerja dengan variabel standar (untuk mencegah pengaruh satu variabel ke yang lain karena masalah penskalaan), tetapi untuk kumpulan data dimensi sangat tinggi (# variabel> 10), Anda pasti harus melihat display lainnya, seperti fluktuasi petak atau heatmap seperti yang digunakan dalam studi microarray.
Ini membantu menjawab pertanyaan seperti:
- Adakah pola skor individual yang konsisten yang dapat dijelaskan oleh keanggotaan kelas tertentu (mis. perbedaan gender)?
- Adakah kovariat sistematis antara skor yang diamati pada dua atau lebih variabel (mis. skor rendah diamati pada variabel X1 selalu dikaitkan dengan skor tinggi pada X2)?
Dalam plot data Iris berikut , terlihat jelas bahwa spesies (di sini diperlihatkan dalam warna berbeda) menunjukkan profil yang sangat diskriminatif ketika mempertimbangkan panjang dan lebar daun bunga, atau bahwa Iris setosa (biru) lebih homogen sehubungan dengan panjang daun bunga mereka ( yaitu varians mereka lebih rendah), misalnya.
Anda bahkan dapat menggunakannya sebagai backend ke teknik klasifikasi atau pengurangan dimensi, seperti PCA. Paling sering, ketika melakukan PCA, selain mengurangi ruang fitur Anda juga ingin menyoroti kelompok individu (misalnya apakah ada individu yang secara sistematis mencetak skor lebih tinggi pada beberapa kombinasi variabel); ini biasanya turun dengan menerapkan semacam pengelompokan hierarkis pada skor faktor dan menyoroti keanggotaan klaster yang dihasilkan pada ruang faktorial (lihat paket FactoClass R).
Ini juga digunakan dalam clustergram ( memvisualisasikan analisis cluster non-hierarkis dan hierarkis ) yang bertujuan untuk memeriksa bagaimana alokasi cluster berkembang ketika meningkatkan jumlah cluster (lihat juga, Apa kriteria berhenti untuk pengelompokan hirarki aglomeratif yang digunakan dalam praktik? ).
Pajangan semacam itu juga berguna ketika ditautkan ke scatterplots biasa (yang oleh konstruksi dibatasi untuk hubungan 2D), ini disebut menyikat dan tersedia di sistem visualisasi data GGobi , atau perangkat lunak Mondrian .