Saya tertarik untuk menerima saran tentang kapan harus menggunakan " skor faktor " dibandingkan jumlah skor saat membuat skala. Yaitu metode "Refined" daripada "non-refined" untuk menilai suatu faktor. Dari DiStefano et al. (2009; pdf ), penekanan ditambahkan:
Ada dua kelas utama metode perhitungan skor faktor: disempurnakan dan tidak disempurnakan. Metode non-rafinasi relatif sederhana, prosedur kumulatif untuk memberikan informasi tentang penempatan individu pada distribusi faktor. Kesederhanaan cocok untuk beberapa fitur menarik, yaitu, metode non-halus keduanya mudah untuk dihitung dan mudah diinterpretasikan. Metode perhitungan yang disempurnakan menciptakan skor faktor menggunakan pendekatan yang lebih canggih dan teknis. Mereka lebih tepat dan kompleks daripada metode yang tidak disempurnakan dan memberikan perkiraan yang merupakan skor terstandarisasi.
Menurut saya, jika tujuannya adalah untuk menciptakan skala yang dapat digunakan lintas studi dan pengaturan, maka jumlah sederhana atau skor rata-rata dari semua item skala masuk akal. Tetapi katakanlah tujuannya adalah untuk mengevaluasi efek pengobatan dari suatu program dan perbedaan penting ada di dalam sampel — kelompok perlakuan vs kelompok kontrol. Apakah ada alasan mengapa kita lebih suka skor faktor daripada menghitung jumlah atau rata-rata?
Agar nyata tentang alternatif, ambil contoh sederhana ini:
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
They are more exact
Penekanan tambahan ini seharusnya tidak mengalihkan kita dari kenyataan bahwa bahkan skor faktor pun pasti tidak pasti ("tidak ditentukan").
"more exact"
. Di antara skor faktor yang dihitung secara linear, metode regresi adalah yang paling "tepat" dalam arti "paling berkorelasi dengan nilai-nilai faktor benar yang tidak diketahui". Jadi ya, lebih tepat (dalam pendekatan aljabar linier), tetapi tidak sepenuhnya tepat.