Tanggapan ini akan membahas model yang mungkin dari perspektif pengukuran , di mana kita diberi satu set variabel yang saling berhubungan (nyata) yang diamati, atau ukuran, yang varians bersama diasumsikan untuk mengukur konstruksi yang teridentifikasi dengan baik tetapi tidak secara langsung diamati (umumnya, dalam reflektif cara), yang akan dianggap sebagai variabel laten . Jika Anda tidak terbiasa dengan model pengukuran sifat laten, saya akan merekomendasikan dua artikel berikut: Serangan para psikometri , oleh Denny Borsbooom, dan Pemodelan Variabel Laten: Sebuah Survei , oleh Anders Skrondal dan Sophia Rabe-Hesketh. Pertama saya akan membuat sedikit penyimpangan dengan indikator biner sebelum berurusan dengan item dengan beberapa kategori respons.
Salah satu cara untuk mengubah data level ordinal menjadi skala interval adalah dengan menggunakan semacam model Item Response . Contoh terkenal adalah model Rasch , yang memperluas gagasan model uji paralel dari teori tes klasik untuk mengatasi item-item yang diberi skor binermelalui model linear efek-campuran yang digeneralisasi (dengan logit) (dalam beberapa implementasi perangkat lunak 'modern'), di mana probabilitas mendukung suatu item adalah fungsi dari 'kesulitan item' dan 'kemampuan orang' (dengan asumsi tidak ada interaksi antara lokasi seseorang pada sifat laten yang diukur dan lokasi barang pada skala logit yang sama - yang dapat ditangkap melalui parameter diskriminasi item tambahan, atau interaksi dengan karakteristik spesifik perorangan - yang disebut fungsi item diferensial ). Konstruk yang mendasarinya diasumsikan unidimensional, dan logika model Rasch hanya bahwa responden memiliki 'jumlah konstruk' tertentu - mari kita bicara tentang tanggung jawab subjek ('kemampuannya'),θθ
N= 766α = 0,971[ 0,967 ; 0,975 ]). Awalnya, lima kategori respons diusulkan (1 = 'Tidak pernah', 2 = 'Jarang', 3 = 'Kadang-kadang', 4 = 'Sering', dan 5 = 'Selalu') untuk setiap item. Kami di sini hanya akan mempertimbangkan tanggapan biner.
(Di sini, respons terhadap item tipe-Likert telah dikodekan ulang sebagai respons biner (1/2 = 0, 3-5 = 1), dan kami menganggap bahwa setiap item sama-sama diskriminatif lintas individu, karenanya paralelisme antara lereng kurva item (Rasch model).)
x
Untuk barang - barang politis dengan kategori yang dipesan, ada beberapa pilihan: model kredit parsial , model skala peringkat , atau model respons bergradasi , untuk menyebutkan beberapa di antaranya yang sebagian besar digunakan dalam penelitian terapan. Dua yang pertama milik apa yang disebut "keluarga Rasch" dari model IRT dan berbagi sifat-sifat berikut: (a) monotonitas fungsi probabilitas respons (kurva respons item / kategori), (b) kecukupan skor total individu (dengan laten parameter dianggap tetap), (c) kemandirian lokal yang berarti bahwa respons terhadap item bersifat independen, tergantung pada sifat laten, dan (d) tidak adanya fungsi item diferensial artinya, tergantung pada sifat laten, respons tidak tergantung pada variabel spesifik individu eksternal (misalnya, jenis kelamin, usia, etnis, SES).
Memperluas contoh sebelumnya ke kasus di mana lima kategori respons secara efektif diperhitungkan, seorang pasien akan memiliki probabilitas yang lebih tinggi untuk memilih kategori respons 3 hingga 5, dibandingkan dengan seseorang yang diambil sampelnya dari populasi umum, tanpa ada anteseden dari gangguan terkait kecemasan. Dibandingkan dengan pemodelan item dikotomis yang dijelaskan di atas, model-model ini mempertimbangkan kumulatif (misalnya, peluang menjawab 3 vs 2 atau kurang) atau ambang batas kategori yang berdekatan (peluang menjawab 3 vs 2), yang juga dibahas dalam Kategorikal Agresti Analisis data(bab 12). Perbedaan utama antara model-model tersebut di atas terletak pada cara transisi dari satu kategori respons ke yang lain ditangani: model kredit parsial tidak mengasumsikan bahwa perbedaan antara lokasi ambang tertentu dan rata-rata lokasi ambang pada sifat laten adalah sama atau seragam di seluruh item, bertentangan dengan model skala penilaian. Perbedaan halus lainnya di antara model-model tersebut adalah bahwa beberapa di antaranya (seperti respons bertingkat atau model kredit parsial) memungkinkan parameter diskriminasi yang tidak sama di antara item. Lihat Menerapkan pemodelan teori respons item untuk mengevaluasi item kuesioner dan properti skala , oleh Reeve dan Fayers, atau Dasar teori respons item , oleh Frank B. Baker, untuk detail lebih lanjut.
Karena dalam kasus sebelumnya kita membahas interpretasi kurva probabilitas respons untuk item yang dikotomi, mari kita lihat kurva respons item yang berasal dari model respons bertingkat, menyoroti item target yang sama:
(Model respons bertingkat yang tidak dibatasi, memungkinkan untuk diskriminasi yang tidak sama di antara item.)
Di sini, pengamatan berikut patut dipertimbangkan:
- [ 2 ; 2.5 ]
- Ada pergeseran keseluruhan, dari kiri ke kanan, antara item menilai kualitas tidur dan mereka yang menilai kondisi lebih parah, meskipun gangguan tidur tidak jarang terjadi. Ini diharapkan: setelah semua, bahkan orang-orang dalam populasi umum mungkin mengalami kesulitan tidur, terlepas dari keadaan kesehatan mereka, dan orang-orang yang sangat tertekan atau cemas cenderung menunjukkan masalah seperti itu. Namun, 'orang normal' (jika ini memiliki makna) tidak mungkin menunjukkan beberapa tanda-tanda gangguan panik (probabilitas mereka memilih kategori respons tertinggi adalah nol untuk orang-orang yang berada pada kisaran menengah atau lebih dari sifat laten, [ 0; 1]).
θ
Selain dianggap sebagai model pengukuran yang sesungguhnya , apa yang membuat model Rasch menarik adalah bahwa skor penjumlahan, sebagai statistik yang memadai , dapat digunakan sebagai pengganti untuk skor laten. Selain itu, sifat kecukupan siap menyiratkan pemisahan model (orang dan item) parameter (dalam hal item-item politis, orang tidak boleh lupa bahwa semuanya berlaku pada tingkat kategori respons item), maka aditivitas bersamaan.
Sebuah review yang baik dari hirarki Model IRT, dengan implementasi R, tersedia dalam Mair dan Hatzinger ini artikel yang diterbitkan dalam Journal of Software statistik : Diperpanjang Rasch Modeling: Paket erm untuk Penerapan Model IRT di R . Model lain termasuk model log-linear , model non-parametrik, seperti model Mokken , atau model grafis .
Selain R, saya tidak mengetahui implementasi Excel, tetapi beberapa paket statistik diusulkan di utas ini: Bagaimana cara memulai dengan menerapkan teori respons barang dan perangkat lunak apa yang digunakan?
Akhirnya, jika Anda ingin mempelajari hubungan antara serangkaian item dan variabel respons tanpa menggunakan model pengukuran, beberapa bentuk kuantisasi variabel melalui penskalaan optimal juga bisa menarik. Terlepas dari implementasi R yang dibahas dalam utas tersebut, solusi SPSS juga diusulkan pada utas terkait .
Referensi
- Pilkonis, P., Choi, S., Reise, S., Stover, A. dan Riley, W. et al. (2011). Item bank untuk mengukur tekanan emosional dari sistem informasi pengukuran hasil yang dilaporkan pasien (PROMIS): Depresi, kecemasan, dan kemarahan . Penilaian , 18 (3), 263–283.
- Choi, S., Gibbons, L. dan Crane, P. (2011). lordif: Paket R untuk mendeteksi fungsi item diferensial menggunakan regresi logistik ordinal iteratif hybrid / Teori Item Response dan simulasi monte carlo . Jurnal Perangkat Lunak Statistik , 39 (8).