Teori Respon Item vs Analisis Faktor Konfirmatori


14

Saya bertanya-tanya apa inti, perbedaan yang bermakna antara Item Response Theory dan Confirmatory Factor Analysis.

Saya mengerti bahwa ada perbedaan dalam perhitungan (lebih fokus pada item vs kovarian; log-linear vs linear).

Namun, saya tidak tahu apa artinya ini dari perspektif tingkat yang lebih tinggi - apakah ini berarti bahwa IRT lebih baik daripada CFA dalam beberapa keadaan? Atau untuk tujuan akhir yang sedikit berbeda?

Setiap renungan akan berguna sebagai pemindaian literatur penelitian yang mengarah ke lebih banyak deskripsi IRT dan CFA daripada perbandingan yang berguna dari perbedaan inti di antara mereka.

Jawaban:


7

Jawaban @Philchalmers ada di titik, dan jika Anda ingin referensi dari salah satu pemimpin di lapangan, Muthen (pencipta Mplus), di sini Anda pergi: (Diedit untuk memasukkan kutipan langsung)

Seorang pengguna MPlus bertanya: Saya mencoba untuk menggambarkan dan menggambarkan persamaan dan perbedaan saat ini antara CFA biner dan IRT untuk tesis saya. Metode estimasi default dalam Mplus untuk CFA kategorikal adalah WLSMV. Untuk menjalankan model IRT, contoh dalam manual Anda menyarankan untuk menggunakan MLR sebagai metode estimasi. Ketika saya menggunakan MLR, apakah input data masih berupa matriks korelasi tetrakorik atau apakah matriks data respons asli digunakan?

Bengt Muthen merespons: Saya tidak berpikir ada perbedaan antara CFA variabel kategorikal dan IRT. Kadang-kadang diklaim tetapi saya tidak setuju. Penaksir mana yang biasanya digunakan mungkin berbeda, tetapi itu tidak penting. MLR menggunakan data mentah, bukan sampel matriks korelasi tetrakorik. ... Pendekatan ML (R) sama dengan pendekatan "marginal ML (MML)" yang dijelaskan dalam misalnya karya Bock. Jadi menggunakan data mentah dan mengintegrasikan faktor menggunakan integrasi numerik. MML dikontraskan dengan "conditional ML" yang digunakan misalnya dengan pendekatan Rasch.

Dengan asumsi faktor normal, probit (normal ogive) hubungan faktor-faktor, dan independensi bersyarat, asumsi yang sama untuk ML dan untuk WLSMV, di mana yang terakhir menggunakan tetrachorics. Ini karena asumsi tersebut sesuai dengan asumsi multivariat normal yang mendasari variabel respon laten berkelanjutan di balik hasil kategorikal. Jadi WLSMV hanya menggunakan informasi urutan pertama dan kedua, sedangkan ML mencapai urutan tertinggi. Hilangnya info tampaknya kecil. ML tidak cocok dengan model untuk sampel tetrachorics ini, jadi mungkin orang dapat mengatakan bahwa WLSMV terpinggirkan dengan cara yang berbeda. Ini masalah perbedaan penduga daripada perbedaan model.

Kami memiliki catatan IRT di situs web kami:

http://www.statmodel.com/download/MplusIRT2.pdf

tetapi sekali lagi, pendekatan ML (R) tidak berbeda dari apa yang digunakan dalam IRT MML.

Sumber: http://www.statmodel.com/discussion/messages/9/10401.html?1347474605


2
Bisakah Anda menyalin dan menempelkan beberapa kutipan yang relevan dari Muthen ke dalam jawaban Anda? Jawaban khusus tautan hanya disukai, khususnya karena tautan cenderung membusuk.
Amoeba berkata Reinstate Monica

2
Saya tidak yakin saya setuju dengan pernyataan Muthen di sini, karena ia tampaknya mendefinisikan IRT dengan cara yang sangat sempit. Ya, model respons 2PL dan bertingkat dapat dipahami dalam kerangka SEM karena mereka memiliki fungsi penghubung kanonis yang bagus, dan karenanya dapat dipesan ulang menggunakan statistik yang cukup lainnya (seperti korelasi polikorik). Tapi bagaimana dengan model IRT lain yang lebih umum, seperti model 3PL, model titik ideal, model kompensasi sebagian, dll? Tentu, beberapa model dapat dipahami dalam kerangka SEM, tapi saya pikir poin saya tentang IRT masih berlaku.
filsuf

17

Dalam beberapa hal Anda benar, CFA dan IRT dipotong dari kain yang sama. Tetapi banyak cara mereka sangat berbeda juga. CFA, atau lebih tepatnya item CFA, adalah adaptasi dari kerangka pemodelan persamaan struktural / kovarian untuk memperhitungkan jenis kovarians tertentu antara item kategorikal. IRT lebih langsung tentang pemodelan hubungan variabel kategori tanpa hanya menggunakan informasi urutan pertama dan kedua dalam variabel (itu informasi lengkap, sehingga persyaratannya umumnya tidak seketat itu).

Item CFA memiliki beberapa manfaat karena termasuk dalam kerangka SEM, dan karena itu memiliki aplikasi yang sangat luas untuk sistem hubungan multivariat dengan variabel lain. IRT, di sisi lain, terutama berfokus pada tes itu sendiri, meskipun kovariat juga dapat dimasukkan dalam tes secara langsung (misalnya, lihat topik tentang penjelas IRT). Saya juga menemukan bahwa hubungan pemodelan item jauh lebih umum dalam kerangka IRT di mana model respons item yang disesuaikan non-monotonik, non-parametrik, atau hanya lebih mudah untuk mengatasi karena orang tidak perlu khawatir tentang kecukupan menggunakan matriks korelasi polikorik.

Kedua kerangka kerja memiliki pro dan kontra, tetapi secara umum CFA lebih fleksibel ketika tingkat pemodelan abstraksi / inferensi difokuskan pada hubungan dalam suatu sistem variabel, sedangkan IRT umumnya lebih disukai jika tes itu sendiri (dan item di dalamnya) adalah fokus minat.


Luar biasa - ini adalah ikhtisar yang indah dan jelas. Phil terima kasih
SimonsSchus

2
Ini harus menjadi jawaban yang diterima.
Vladislavs Dovgalecs

2

Saya percaya Yves Rosseel membahasnya secara singkat dalam slide 91-93 dari lokakarya 2014: http://www.personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf

Diambil dari Rosseel (2014, tautan di atas):

Pendekatan informasi lengkap: kemungkinan maksimum marjinal

asal: model IRT (misalnya Bock & Lieberman, 1970) dan GLMMs

...

koneksi dengan IRT

• hubungan teoritis antara SEM dan IRT telah didokumentasikan dengan baik:

Takane, Y., & De Leeuw, J. (1987). Pada hubungan antara teori respon item dan analisis faktor variabel diskritisasi. Psychome- trika, 52, 393-408.

Kamata, A., & Bauer, DJ (2008). Catatan tentang hubungan antara model faktor analitik dan item response theory. Pemodelan Persamaan Struktural, 15, 136-153.

Joreskog, KG, & Moustaki, I. (2001). Analisis faktor variabel ordinal: Perbandingan tiga pendekatan. Penelitian Perilaku Multivariat, 36, 347-387.

kapan mereka setara?

• probit (normal-ogive) versus logit: kedua metrik digunakan dalam praktik

• CFA faktor tunggal pada item biner setara dengan model IRT 2-parameter (Birnbaum, 1968):

Dalam CFA: ... Dalam IRT: ... (lihat slide)

• CFA faktor tunggal pada item polikotom (ordinal) setara dengan model respons bertingkat (Samejima, 1969)

• tidak ada padanan CFA untuk model 3-parameter (dengan parameter dugaan)

• model Rasch setara dengan CFA faktor-tunggal pada item-item biner, tetapi di mana semua muatan faktor dibatasi menjadi sama (dan metrik probit dikonversi ke metrik logit)

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.