Haruskah data dipusatkan + diskalakan sebelum menerapkan t-SNE?

Beberapa fitur data saya memiliki nilai besar, sedangkan fitur lainnya memiliki nilai jauh lebih kecil.

Apakah perlu memusatkan + skala data sebelum menerapkan t-SNE untuk mencegah bias terhadap nilai yang lebih besar?

Saya menggunakan implementasi sklearn.manifold.TSNE dari Python dengan metrik jarak euclidean default.

— stmax
sumber

Jawaban:

Pemusatan seharusnya tidak menjadi masalah karena algoritme hanya beroperasi pada jarak antar titik, namun pengukuran ulang diperlukan jika Anda ingin dimensi yang berbeda diperlakukan dengan kepentingan yang sama, karena 2-norma akan lebih banyak dipengaruhi oleh dimensi dengan varian besar.

— jon_simon
sumber

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.

Licensed under cc by-sa 3.0 with attribution required.