Apa alasannya, jika ada, untuk menggunakan Analisis Diskriminan (DA) pada hasil algoritma pengelompokan seperti k-means, seperti yang saya lihat dari waktu ke waktu dalam literatur (pada dasarnya pada subtyping klinis gangguan mental)?
Umumnya tidak direkomendasikan untuk menguji perbedaan kelompok pada variabel yang digunakan selama konstruksi cluster karena mereka mendukung maksimalisasi (minimalisasi resp) dari inersia antar-kelas (resp. Dalam-kelas). Jadi, saya tidak yakin untuk sepenuhnya menghargai nilai tambah DA prediktif, kecuali kita berusaha untuk menanamkan individu dalam ruang faktorial dengan dimensi yang lebih rendah dan mendapatkan gagasan tentang "generalisasi" dari partisi semacam itu. Tetapi bahkan dalam kasus ini, analisis cluster tetap secara fundamental merupakan alat eksplorasi, sehingga menggunakan keanggotaan kelas yang dikomputasi dengan cara ini untuk mendapatkan aturan penilaian lebih lanjut tampak aneh pada pandangan pertama.
Adakah rekomendasi, ide, atau petunjuk ke makalah yang relevan?
R
: cran.r-project.org/web/packages/adegenet/vignettes/…