Saya memiliki dataset yang nominal 16 dimensi. Saya memiliki sekitar 100 sampel dalam satu kasus dan sekitar 20.000 lainnya. Berdasarkan berbagai analisis eksplorasi yang telah saya lakukan menggunakan PCA dan peta panas, saya yakin bahwa dimensi sebenarnya (yaitu jumlah dimensi yang diperlukan untuk menangkap sebagian besar "sinyal") adalah sekitar 4. Saya ingin membuat slide untuk efek itu untuk presentasi. "Kearifan konvensional" tentang data ini, yang ingin saya buktikan, adalah bahwa dimensi sejati adalah satu atau dua.
Apa visualisasi yang bagus dan sederhana untuk menunjukkan dimensi sebenarnya dari suatu dataset? Sebaiknya dimengerti oleh orang-orang yang memiliki latar belakang statistik tetapi bukan ahli statistik "nyata".