Validasi kuesioner dalam populasi baru

Saya memiliki 400 tanggapan terhadap 20 item kuesioner yang dimaksudkan untuk mengukur konstitusi sikap pada mahasiswa kedokteran. Instrumen ini divalidasi di AS selama satu tahun mahasiswa kedokteran dan data yang dipublikasikan sangat "bersih" - semua nilai ritc> 0,3, alpha 0,84, PCA dengan struktur empat faktor yang stabil dll. Dalam sampel saya, saya telah menemukan 5 dari 20 item memiliki ritc <0,2 dan dalam subpopulasi budaya (n = 70) nilai ritc ini nol / negatif. Jika saya mempertahankan semua itu, mereka yang memiliki ritc yang buruk tidak memuat pada faktor apa pun atau mengurutkan ke dalam 2-item factor toegther (faktor 4). Saya bersyukur bahwa (& ingin menyelidiki) ini disebabkan oleh (i) subpopulasi budaya kecil yang kendalanya mungkin tidak dapat ditangkap, atau (ii) karena saya mendapat tanggapan dari siswa di semua tahapan program dan ada aspek perkembangan terhadap konstruk yang ditangkap dengan buruk oleh item skala. Apakah ada tes statistik yang akan memungkinkan saya untuk menyelidiki ini?

Haruskah item dengan ritc dihapus dari skala dan jika demikian saya melakukan ini secara berurutan dimulai dengan yang terendah dan pada titik apa saya harus berhenti menghapus item / apakah saya kehilangan sesuatu dari kuesioner? Jika saya ingin membandingkan struktur faktor skala antara subpopulasi besar dan kecil, bagaimana saya mencoba ini atau apakah subsampel minor terlalu kecil untuk menarik kesimpulan? Referensi apa pun akan sangat dihargai.

Akhirnya, tujuan memvalidasi skala adalah untuk menggunakannya untuk menentukan efektivitas intervensi menggunakan skor intervensi sebelum dan sesudah - jika suatu item memiliki ritc rendah, saya kira itu dapat berdampak pada keandalan skala dalam pengaturan eksperimental, atau saya salah? Apakah ada cara statistik untuk menentukan kegunaan skala yang dirancang untuk mengukur konstruksi yang memiliki aspek perkembangan - yaitu apakah semua item berfungsi dengan tepat ketika siswa mengembangkan "lebih banyak" dari konstruk sikap?

— suzi
sumber

Apa itu "ritc"?

— gung - Reinstate Monica

+1 ke @ung. Saya juga tidak tahu dan gelar saya di bidang psikometri.

— Peter Flom

Hai-maaf tidak keluar seperti yang saya harapkan ketika mengetik-itu adalah nilai korelasi total item yang dikoreksi untuk setiap item skala

— suzi

Banyak yang terjadi. Dengan bolak-balik yang cukup Anda mungkin mendapatkan beberapa pertanyaan Anda dijawab dengan cara yang memuaskan melalui situs ini, tetapi untuk membuat kemajuan lebih dari itu, Anda mungkin akan memerlukan bantuan konsultan yang mendalam.

— rolando2

Saya setuju dengan @ rolando2. Satu pemikiran cepat, saya tidak yakin apakah mengandalkan analisis faktor untuk 20 item berdasarkan 70 responden.

— David

@suzi Salah satu properti yang menjadi dasar analisis Rasch adalah bahwa langkah-langkahnya tidak berbeda dengan subkelompok. Properti ini mendukung pengembangan pengujian adaptif komputer dan penyetaraan pengujian. Jika invariansi ukuran ini berlaku dalam suatu populasi, maka tidak ada fungsi item diferensial (DIF). Untuk membantu Anda dengan sampel Anda, Anda bisa menjalankan analisis Rasch untuk setiap subkelompok dan membandingkan fungsi item dari setiap item untuk setiap subkelompok. Jika ukuran item berbeda lebih dari 0,50 log (atau lebih besar dari interval kepercayaan 95% dari ukuran), maka DIF hadir dan item tidak invarian. Selama subkelompok Anda memiliki tidak kurang dari 70 mata pelajaran, Anda harus baik-baik saja.

Makalah yang sangat baik tentang penerapan prinsip ini adalah "Statistik Rasch Fit sebagai Tes Invariansi Perkiraan Parameter Barang", Smith, Richard M. dan Suh, Kyunghee, Jurnal Pengukuran Terapan 4 (2) 153-163.

Seperti yang dinyatakan dalam komentar, ini adalah bidang yang luas dan Anda mungkin perlu bantuan. Jika memungkinkan, Anda dapat mencari bantuan melalui Rasch SIG . Perangkat lunak akan mencakup Winsteps, Facet, RUMM, eRm, dan program lain di R.

Semoga ini membantu.

— sial
sumber

Bukankah itu item diferensial berfungsi?

— Behacad