Apakah ada arti untuk dimensi embedding t-sne? Seperti halnya PCA, kami memiliki perasaan ini untuk memaksimalkan varians linear, tetapi untuk t-sne apakah ada intuisi selain hanya ruang yang kami tetapkan untuk pemetaan dan minimalisasi jarak-KL?
Apakah ada arti untuk dimensi embedding t-sne? Seperti halnya PCA, kami memiliki perasaan ini untuk memaksimalkan varians linear, tetapi untuk t-sne apakah ada intuisi selain hanya ruang yang kami tetapkan untuk pemetaan dan minimalisasi jarak-KL?
Jawaban:
Dimensi ruang dimensi rendah tidak memiliki arti. Perhatikan bahwa fungsi kehilangan t-SNE semata-mata didasarkan pada jarak antara titik ( dan ) dan distribusi probabilitas pada jarak tersebut ( dan ):
Dengan demikian tidak ada proyeksi dari seluruh ruang dimensi tinggi ke ruang dimensi rendah, t-SNE hanya menemukan pemetaan dari serangkaian titik dimensi tinggi tertentu ke rangkaian titik dimensi rendah tertentu. Karena tidak ada fungsi dari satu ruang ke ruang lain juga tidak ada makna yang melekat dari sumbu.
Hal-hal yang dapat Anda bayangkan untuk menggambarkan hal ini:
Karena itu, t-SNE terutama merupakan teknik visualisasi dan efektivitas pengurangan dimensinya untuk tujuan lain tidak jelas (mungkin tidak cocok untuk pengelompokan, ekstraksi fitur, atau pemilihan fitur).
Juga: kertas .