Penjelasan mudah untuk plot koordinat paralel


13

Saya telah membaca dan melihat banyak plot Koordinat paralel. Dapatkah seseorang menjawab serangkaian pertanyaan berikut:

  1. Apa yang dimaksud dengan plot koordinat paralel (PCP) dalam kata-kata sederhana, sehingga orang awam dapat mengerti?
  2. Penjelasan matematis dengan beberapa intuisi jika memungkinkan
  3. Kapan PCP berguna dan kapan menggunakannya?
  4. Kapan PCP tidak berguna dan kapan mereka harus dihindari?
  5. Kemungkinan kelebihan dan kekurangan PCP

Topik hebat - Anda akan mendapatkan banyak +1 untuk pertanyaan ini ...
Tal Galili

1
@Tal .. terima kasih :-) Tapi saya ingin tahu lebih banyak dan mungkin memperluas artikel Wiki, yang tidak terlalu informatif.
suncoolsu

Insentif besar :)
Tal Galili

Jawaban:


6

Tampak bagi saya bahwa fungsi utama PCP adalah untuk menyoroti kelompok-kelompok individu yang homogen, atau sebaliknya (dalam ruang ganda, dengan analogi dengan PCA) pola-pola asosiasi spesifik pada variabel yang berbeda. Ini menghasilkan ringkasan grafis yang efektif dari kumpulan data multivarian, ketika tidak ada terlalu banyak variabel. Variabel secara otomatis diskalakan ke rentang tetap (biasanya, 0-1) yang setara dengan bekerja dengan variabel standar (untuk mencegah pengaruh satu variabel ke yang lain karena masalah penskalaan), tetapi untuk kumpulan data dimensi sangat tinggi (# variabel> 10), Anda pasti harus melihat display lainnya, seperti fluktuasi petak atau heatmap seperti yang digunakan dalam studi microarray.

Ini membantu menjawab pertanyaan seperti:

  • Adakah pola skor individual yang konsisten yang dapat dijelaskan oleh keanggotaan kelas tertentu (mis. perbedaan gender)?
  • Adakah kovariat sistematis antara skor yang diamati pada dua atau lebih variabel (mis. skor rendah diamati pada variabel X1 selalu dikaitkan dengan skor tinggi pada X2)?

Dalam plot data Iris berikut , terlihat jelas bahwa spesies (di sini diperlihatkan dalam warna berbeda) menunjukkan profil yang sangat diskriminatif ketika mempertimbangkan panjang dan lebar daun bunga, atau bahwa Iris setosa (biru) lebih homogen sehubungan dengan panjang daun bunga mereka ( yaitu varians mereka lebih rendah), misalnya.

teks alternatif

Anda bahkan dapat menggunakannya sebagai backend ke teknik klasifikasi atau pengurangan dimensi, seperti PCA. Paling sering, ketika melakukan PCA, selain mengurangi ruang fitur Anda juga ingin menyoroti kelompok individu (misalnya apakah ada individu yang secara sistematis mencetak skor lebih tinggi pada beberapa kombinasi variabel); ini biasanya turun dengan menerapkan semacam pengelompokan hierarkis pada skor faktor dan menyoroti keanggotaan klaster yang dihasilkan pada ruang faktorial (lihat paket FactoClass R).

Ini juga digunakan dalam clustergram ( memvisualisasikan analisis cluster non-hierarkis dan hierarkis ) yang bertujuan untuk memeriksa bagaimana alokasi cluster berkembang ketika meningkatkan jumlah cluster (lihat juga, Apa kriteria berhenti untuk pengelompokan hirarki aglomeratif yang digunakan dalam praktik? ).

Pajangan semacam itu juga berguna ketika ditautkan ke scatterplots biasa (yang oleh konstruksi dibatasi untuk hubungan 2D), ini disebut menyikat dan tersedia di sistem visualisasi data GGobi , atau perangkat lunak Mondrian .


4

Sehubungan dengan pertanyaan 3, 4, dan 5 saya sarankan Anda memeriksa pekerjaan ini

Menganggap pola dalam koordinat paralel: menentukan ambang batas untuk identifikasi hubungan oleh: Jimmy Johansson, Camilla Forsell, Mats Lind, Matthew Cooper dalam Visualisasi Informasi, Vol. 7, No. 2. (2008), hlm. 152-162.

Untuk meringkas temuan mereka, orang-orang baik dalam mengidentifikasi arah kemiringan hubungan antara setiap node, tetapi tidak pandai mengidentifikasi kekuatan hubungan atau tingkat kemiringan. Mereka memberikan tingkat kebisingan yang disarankan di mana orang masih dapat menguraikan hubungan dalam artikel tersebut. Sayangnya artikel ini tidak membahas identifikasi subkelompok melalui warna seperti yang ditunjukkan oleh chl.


4

Silakan kunjungi http://www.cs.tau.ac.il/~aiisreal/ dan lihat juga buku yang baru

Koordinat Paralel - Buku ini membahas tentang visualisasi, yang secara sistematis memasukkan pengenalan pola manusia yang fantastis ke dalam proses pemecahan masalah ... www.springer.com/math/cse/book/978-0-387-21507-5.

Dalam Ch. 10 ada banyak contoh nyata dengan data multivarian yang menunjukkan bagaimana koordinat paralel (abbr. || -cs) dapat digunakan. Anda juga perlu mempelajari beberapa matematika untuk memvisualisasikan dan bekerja dengan hubungan multivariat / multidimensi (permukaan) dan tidak hanya set point. Sangat menyenangkan melihat dan bekerja dengan analog dari benda-benda yang akrab di banyak dimensi yaitu strip Moebius, set cembung dan banyak lagi.

Singkatnya || -cs adalah sistem koordinat multidimensi di mana sumbu sejajar satu sama lain sehingga memungkinkan banyak sumbu terlihat. Metodologi ini telah diterapkan pada algoritma resolusi konflik dalam Kontrol Lalu Lintas Udara, Visi Komputer, Kontrol Proses dan Dukungan Keputusan.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.