Mengutip dari salah satu penulis:
t-Distributed Stochastic Neighbor Embedding (t-SNE) adalah teknik ( pemenang hadiah ) untuk pengurangan dimensi yang sangat cocok untuk visualisasi dataset dimensi tinggi.
Jadi kedengarannya hebat, tapi itu yang penulis bicarakan.
Kutipan lain dari penulis (re: kompetisi yang disebutkan sebelumnya):
Apa yang telah Anda ambil dari kompetisi ini?
Selalu visualisasikan data Anda terlebih dahulu, sebelum Anda mulai melatih prediktor pada data! Seringkali, visualisasi seperti yang saya buat memberikan wawasan tentang distribusi data yang dapat membantu Anda dalam menentukan jenis model prediksi yang akan dicoba.
Informasi harus 1 hilang - itu adalah teknik reduksi dimensi. Namun, karena ini adalah teknik yang baik untuk digunakan ketika memvisualisasikan, informasi yang hilang kurang berharga daripada informasi yang disorot (/ dibuat terlihat / dapat dipahami melalui reduksi menjadi 2 atau 3 dimensi).
Jadi pertanyaan saya adalah:
- Kapan tSNE alat yang salah untuk pekerjaan itu?
- Jenis data apa yang menyebabkannya tidak berfungsi,
- Pertanyaan macam apa yang kelihatannya bisa dijawab, tetapi sebenarnya tidak bisa?
- Dalam kutipan kedua di atas, disarankan untuk selalu memvisualisasikan set data Anda, haruskah visualisasi ini selalu dilakukan dengan tSNE?
Saya berharap bahwa pertanyaan ini mungkin paling baik dijawab dalam percakapan, yaitu menjawab: Kapan tSNE alat yang tepat untuk pekerjaan itu?
Saya telah diperingatkan untuk tidak mengandalkan tSNE untuk memberi tahu saya betapa mudahnya data akan dapat diklasifikasikan (dipisahkan menjadi kelas - model diskriminatif) Contoh yang menyesatkan adalah, bahwa, untuk dua gambar di bawah ini, model generatif 2 lebih buruk untuk data yang divisualisasikan di pertama / kiri (akurasi 53,6%) dari yang setara untuk yang kedua / kanan (akurasi 67,2%).
1 Saya bisa saja salah tentang hal ini. Saya dapat duduk dan mencoba bukti / contoh balasan nanti
Saya perhatikan bahwa model generatif tidak sama dengan model diskriminatif, tetapi ini adalah contoh yang saya berikan.