Saya seorang mahasiswa pascasarjana dalam ilmu komputer. Saya telah melakukan beberapa analisis faktor eksplorasi untuk proyek penelitian. Rekan-rekan saya (yang memimpin proyek) menggunakan SPSS, sementara saya lebih suka menggunakan R. Ini tidak masalah sampai kami menemukan perbedaan besar antara dua paket statistik.
Kami menggunakan pemfaktoran sumbu utama sebagai metode ekstraksi (harap dicatat bahwa saya menyadari perbedaan antara PCA dan analisis faktor, dan bahwa kami tidak menggunakan PCA , setidaknya tidak dengan sengaja). Dari apa yang saya baca, ini harus sesuai dengan metode "sumbu utama" di R, dan baik "anjak piutang sumbu utama" atau "tertimbang kuadrat" di SPSS, menurut dokumentasi R . Kami menggunakan metode rotasi miring (khususnya, promax ) karena kami mengharapkan faktor yang berkorelasi, dan menafsirkan matriks pola .
Menjalankan dua prosedur dalam R dan SPSS, ada perbedaan besar. Matriks pola memberikan beban yang berbeda. Meskipun ini memberikan lebih atau kurang faktor yang sama untuk hubungan variabel, ada hingga 0,15 perbedaan antara beban yang sesuai, yang tampaknya lebih dari yang diharapkan oleh hanya implementasi yang berbeda dari metode ekstraksi dan rotasi promax. Namun, itu bukan perbedaan yang paling mengejutkan.
Varians kumulatif yang dijelaskan oleh faktor-faktor tersebut adalah sekitar 40% dalam hasil SPSS, dan 31% dalam hasil R. Ini adalah perbedaan besar, dan telah menyebabkan kolega saya ingin menggunakan SPSS alih-alih R. Saya tidak punya masalah dengan ini, tetapi perbedaan yang besar membuat saya berpikir bahwa kita mungkin menafsirkan sesuatu secara tidak benar, yang merupakan masalah.
Semakin memperkeruh perairan, SPSS melaporkan berbagai jenis varian yang dijelaskan ketika kami menjalankan anjak kuadrat terkecil berbobot. Proporsi varians yang dijelaskan oleh Initial Eigenvalues adalah 40%, sedangkan proporsi varians yang dijelaskan dari Jumlah Ekstraksi Jumlah Pemadatan Kuadrat (SSL) adalah 33%. Ini membuat saya berpikir bahwa Nilai Eigen Awal bukan angka yang tepat untuk dilihat (saya menduga ini adalah perbedaan yang dijelaskan sebelum rotasi, meskipun yang begitu besar di luar saya). Yang lebih membingungkan, SPSS juga menunjukkan Rotasi SSL, tetapi tidak menghitung persentase varian yang dijelaskan (SPSS memberitahu saya bahwa memiliki faktor yang berkorelasi berarti saya tidak dapat menambahkan SSL untuk menemukan varian total, yang masuk akal dengan matematika yang pernah saya lihat). SSL yang dilaporkan dari R tidak cocok dengan semua ini, dan R memberitahu saya bahwa itu menggambarkan 31% dari total varians. SSL R cocok dengan Rotasi SSL yang paling dekat. Nilai eigen R dari matriks korelasi asli memang cocok dengan nilai Eigen awal dari SPSS.
Juga, harap dicatat bahwa saya telah bermain-main dengan menggunakan metode yang berbeda, dan bahwa ULS dan PAF SPSS tampaknya cocok dengan metode PA R yang paling dekat.
Pertanyaan spesifik saya:
- Berapa banyak perbedaan yang harus saya harapkan antara R dan SPSS dengan implementasi analisis faktor?
- Manakah dari Jumlah Beban Kuadrat dari SPSS yang harus saya interpretasikan, Nilai Eigen Awal, Ekstraksi, atau Rotasi?
- Apakah ada masalah lain yang mungkin saya abaikan?
Panggilan saya ke SPSS dan R adalah sebagai berikut:
SPSS:
FACTOR
/VARIABLES <variables>
/MISSING PAIRWISE
/ANALYSIS <variables>
/PRINT INITIAL KMO AIC EXTRACTION ROTATION
/FORMAT BLANK(.35)
/CRITERIA FACTORS(6) ITERATE(25)
/EXTRACTION ULS
/CRITERIA ITERATE(25)
/ROTATION PROMAX(4).
R:
library(psych)
fa.results <- fa(data, nfactors=6, rotate="promax",
scores=TRUE, fm="pa", oblique.scores=FALSE, max.iter=25)