Haruskah data dipusatkan + diskalakan sebelum menerapkan t-SNE?


18

Beberapa fitur data saya memiliki nilai besar, sedangkan fitur lainnya memiliki nilai jauh lebih kecil.

Apakah perlu memusatkan + skala data sebelum menerapkan t-SNE untuk mencegah bias terhadap nilai yang lebih besar?

Saya menggunakan implementasi sklearn.manifold.TSNE dari Python dengan metrik jarak euclidean default.

Jawaban:


18

Pemusatan seharusnya tidak menjadi masalah karena algoritme hanya beroperasi pada jarak antar titik, namun pengukuran ulang diperlukan jika Anda ingin dimensi yang berbeda diperlakukan dengan kepentingan yang sama, karena 2-norma akan lebih banyak dipengaruhi oleh dimensi dengan varian besar.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.