Tidak seperti analisis komponen utama, solusi untuk model analisis faktor tidak harus bersarang. Yaitu, beban (misalnya) untuk faktor pertama tidak harus sama ketika hanya faktor pertama yang diekstraksi vs. ketika dua faktor pertama.
Dengan mengingat hal itu, pertimbangkan kasus di mana Anda memiliki satu set variabel manifes yang sangat berkorelasi dan (berdasarkan pengetahuan teoretis konten mereka) harus didorong oleh satu faktor tunggal. Bayangkan bahwa analisis faktor eksplorasi (dengan metrik apa pun yang Anda inginkan: analisis paralel, plot scree, nilai eigen> 1, dll.) Sangat menunjukkan bahwa ada faktor: faktor primer besar, dan faktor sekunder kecil. Anda tertarik menggunakan variabel manifes dan solusi faktor untuk memperkirakan (yaitu, mendapatkan skor faktor) nilai peserta untuk faktor pertama. Dalam skenario ini, apakah akan lebih baik untuk:
- Cocokkan model faktor untuk mengekstraksi hanya faktor, dan dapatkan skor faktor (dll.), Atau
- cocok dengan model faktor untuk mengekstraksi kedua faktor, dapatkan skor faktor untuk faktor-faktor tersebut, tetapi buang / abaikan skor untuk faktor kedua?
Untuk praktik mana yang lebih baik, mengapa? Apakah ada penelitian tentang masalah ini?
Is is always better to extract more factors when they exist?
tidak terlalu jelas. Itu selalu lebih baik untuk mengekstrak sebanyak yang ada. Underfitting atau overfitting mengubah struktur laten "benar" karena sifat multivarian dan non-bersarang dari analisis yang disebutkan oleh Anda. Masalahnya adalah kita tidak tahu persis berapa banyak faktor yang ada dalam data kita. Dan apakah data ini memiliki sebanyak populasi.