Saya memiliki 400 tanggapan terhadap 20 item kuesioner yang dimaksudkan untuk mengukur konstitusi sikap pada mahasiswa kedokteran. Instrumen ini divalidasi di AS selama satu tahun mahasiswa kedokteran dan data yang dipublikasikan sangat "bersih" - semua nilai ritc> 0,3, alpha 0,84, PCA dengan struktur empat faktor yang stabil dll. Dalam sampel saya, saya telah menemukan 5 dari 20 item memiliki ritc <0,2 dan dalam subpopulasi budaya (n = 70) nilai ritc ini nol / negatif. Jika saya mempertahankan semua itu, mereka yang memiliki ritc yang buruk tidak memuat pada faktor apa pun atau mengurutkan ke dalam 2-item factor toegther (faktor 4). Saya bersyukur bahwa (& ingin menyelidiki) ini disebabkan oleh (i) subpopulasi budaya kecil yang kendalanya mungkin tidak dapat ditangkap, atau (ii) karena saya mendapat tanggapan dari siswa di semua tahapan program dan ada aspek perkembangan terhadap konstruk yang ditangkap dengan buruk oleh item skala. Apakah ada tes statistik yang akan memungkinkan saya untuk menyelidiki ini?
Haruskah item dengan ritc dihapus dari skala dan jika demikian saya melakukan ini secara berurutan dimulai dengan yang terendah dan pada titik apa saya harus berhenti menghapus item / apakah saya kehilangan sesuatu dari kuesioner? Jika saya ingin membandingkan struktur faktor skala antara subpopulasi besar dan kecil, bagaimana saya mencoba ini atau apakah subsampel minor terlalu kecil untuk menarik kesimpulan? Referensi apa pun akan sangat dihargai.
Akhirnya, tujuan memvalidasi skala adalah untuk menggunakannya untuk menentukan efektivitas intervensi menggunakan skor intervensi sebelum dan sesudah - jika suatu item memiliki ritc rendah, saya kira itu dapat berdampak pada keandalan skala dalam pengaturan eksperimental, atau saya salah? Apakah ada cara statistik untuk menentukan kegunaan skala yang dirancang untuk mengukur konstruksi yang memiliki aspek perkembangan - yaitu apakah semua item berfungsi dengan tepat ketika siswa mengembangkan "lebih banyak" dari konstruk sikap?