Saya akrab dengan menggunakan wawasan dari Teori Matriks Acak untuk menentukan jumlah komponen utama dari PCA dari matriks kovarians / korelasi yang digunakan untuk membentuk faktor.
Jika nilai eigen yang terkait dengan PC pertama besar, maka itu berarti bahwa nilai eigen yang tersisa harus kecil (karena jumlah nilai eigen harus sama dengan jejak matriks korelasi). Ketika PC pertama cukup besar, maka sangat mungkin bahwa semua nilai eigen ini berada di bawah batas bawah pada distribusi Marcenko-Pastur. Ini masuk akal bahwa mereka rendah bukan karena kesempatan acak, tetapi karena nilai eigen pertama sangat besar. Namun, itu tidak berarti bahwa mereka mengandung informasi yang signifikan. Alih-alih, akan lebih masuk akal untuk mengajukan pertanyaan "mengingat PC pertama adalah sejumlah besar, seperti apa distribusi nilai-nilai eigen yang tersisa jika data acak yang bertanggung jawab atas mereka?"
Apakah ada penelitian yang membahas masalah ini? Jika dimungkinkan untuk mendapatkan distribusi Marcenko-Pastur dengan syarat mengetahui satu atau lebih nilai eigen, maka akan mungkin untuk melanjutkan secara iteratif untuk menentukan apakah faktor-faktor mencerminkan informasi yang signifikan.