Dalam penugasan terbaru, kami disuruh menggunakan PCA pada digit MNIST untuk mengurangi dimensi dari 64 (8 x 8 gambar) menjadi 2. Kami kemudian harus mengelompokkan digit menggunakan Gaussian Mixture Model. PCA hanya menggunakan 2 komponen utama tidak menghasilkan cluster yang berbeda dan akibatnya model tidak dapat menghasilkan pengelompokan yang bermanfaat.
Namun, dengan menggunakan t-SNE dengan 2 komponen, kelompok-kelompok tersebut jauh lebih baik dipisahkan. Model Campuran Gaussian menghasilkan lebih banyak kluster yang berbeda ketika diterapkan pada komponen t-SNE.
Perbedaan PCA dengan 2 komponen dan t-SNE dengan 2 komponen dapat dilihat pada pasangan gambar berikut di mana transformasi telah diterapkan pada dataset MNIST.
Saya telah membaca bahwa t-SNE hanya digunakan untuk visualisasi data dimensi tinggi, seperti dalam jawaban ini , namun mengingat kluster berbeda yang dihasilkannya, mengapa itu tidak digunakan sebagai teknik pengurangan dimensi yang kemudian digunakan untuk model klasifikasi atau sebagai metode pengelompokan mandiri?