Anda benar bahwa nilai-nilai yang sama di T-SNE dapat didistribusikan di berbagai titik, alasan ini terjadi jelas jika Anda melihat pada algoritma yang dijalankan oleh T-SNE.
x1=[0,1]x2=[0,1]
import numpy as np
from sklearn.manifold import TSNE
m = TSNE(n_components=2, random_state=0)
m.fit_transform(np.array([[0,1],[0,1]]))
Anda juga akan mengamati bahwa mengubah yang random_state
sebenarnya memodifikasi koordinat output dari model. Tidak ada korelasi nyata antara koordinat aktual dan outputnya. Sejak langkah pertama TSNE menghitung kemungkinan bersyarat.
xixjpj|i=exp(−||xj−xi||22σ2)∑k≠iexp(−||xj−xi||22σ2)pij=pi|j+pj|i2Npijxixj
R2
Jadi, kebenarannya adalah, alih-alih melihat kedua kelompok itu, lihatlah jarak di antara mereka, karena itu menyampaikan lebih banyak informasi daripada mengoordinasikan diri mereka sendiri.
Semoga ini menjawab pertanyaan Anda :)