Pemberitahuan setelah tabel ANOVA setelah analisis K-means menunjukkan bahwa tingkat signifikansi tidak boleh dilihat sebagai uji sarana yang sama, karena solusi klaster telah diturunkan berdasarkan jarak Euclidean untuk memaksimalkan jarak. Tes apa yang harus saya gunakan untuk menunjukkan apakah rata-rata variabel pengelompokan berbeda di antara kluster? Saya telah melihat peringatan ini dalam tabel ANOVA k-means keluaran yang disediakan, tetapi dalam beberapa referensi saya melihat bahwa tes ANOVA post-hoc dijalankan. Haruskah saya mengabaikan hasil ANOVA k-mean dan menjalankan ANOVA satu arah dengan tes post-hoc dan menafsirkannya dengan cara tradisional? Atau bisakah saya hanya menyiratkan tentang besarnya nilai F dan variabel mana yang berkontribusi lebih besar terhadap perbedaan? Kebingungan lainnya adalah bahwa variabel cluster tidak terdistribusi secara normal melanggar asumsi ANOVA, maka saya bisa menggunakan tes non-parametrik Kruskal-Wallis, tetapi memiliki asumsi tentang distribusi yang sama. Distribusi antar-kluster untuk variabel spesifik tidak tampak sama, ada yang condong positif, ada yang negatif ... Saya punya 1.275 sampel besar, 5 klaster, 10 variabel klaster yang diukur dalam skor PCA.