Berikut ini adalah daftar indeks penyalinan jawaban yang mengejutkan, dengan sedikit pembahasan tentang kelebihannya: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Ada bidang psikologi (pendidikan) yang disebut teori respons item (IRT) yang menyediakan latar belakang statistik untuk pertanyaan seperti ini. Jika Anda seorang Amerika, dan mengikuti SAT, ACT atau GRE, Anda berurusan dengan tes yang dikembangkan dengan IRT. Postulat dasar IRT adalah bahwa setiap siswa dicirikan oleh kemampuan mereka ; setiap pertanyaan ditandai dengan kesulitannya ; dan probabilitas untuk menjawab pertanyaan dengan benar adalah
mana adalah cdf dari standar normal, daniaibj
π(ai,bj;c)=Prob[student i answers question j correctly]=Φ(c(ai−bj))
Φ(z)cadalah parameter sensitivitas / diskriminasi tambahan (kadang-kadang, dibuat khusus pertanyaan, , jika ada informasi yang cukup, yaitu, peserta tes yang cukup, untuk mengidentifikasi perbedaan). Asumsi tersembunyi di sini bahwa mengingat kemampuan siswa , jawaban atas berbagai pertanyaan independen. Asumsi ini dilanggar jika Anda memiliki banyak pertanyaan tentang mengatakan paragraf teks yang sama, tetapi mari kita abstraksi darinya sebentar.
cji
Untuk pertanyaan "Ya / Tidak", ini mungkin akhir dari cerita. Untuk lebih dari dua pertanyaan kategori, kita dapat membuat asumsi tambahan bahwa semua pilihan yang salah memiliki kemungkinan yang sama; untuk pertanyaan dengan pilihan , probabilitas setiap pilihan yang salah adalah .jkjπ′(ai,bj;c)=[1−π(ai,bj;c)]/(kj−1)
Untuk siswa kemampuan dan , probabilitas bahwa mereka cocok dengan jawaban mereka untuk pertanyaan dengan kesulitan adalah
Jika Anda suka, Anda dapat memecah ini menjadi probabilitas pencocokan pada jawaban yang benar, , dan probabilitas untuk mencocokkan jawaban yang salah, , meskipun dari kerangka kerja konseptual IRT, perbedaan ini hampir tidak material.aiakbj
ψ(ai,ak;bj,c)=π(ai,bj;c)π(ak,bj;c)+(k−1)π′(ai,bj;c)π′(ak,bj;c)
ψc(ai,ak;bj,c)=π(ai,bj;c)π(ak,bj;c)ψi(ai,ak;bj,c)=(k−1)π′(ai,bj;c)π′(ak,bj;c)
Sekarang, Anda dapat menghitung probabilitas pencocokan, tetapi mungkin sangat kecil secara kombinasi. Ukuran yang lebih baik mungkin rasio informasi dalam pola tanggapan berpasangan,
dan hubungkan ke entropi
Anda dapat melakukan ini untuk semua pasangan siswa, plot mereka atau rangking mereka, dan selidiki rasio informasi terbesar untuk entropi.
I(i,k)=∑j1{matchj}lnψ(ai,ak;bj,c)+1{non-matchj}ln[1−ψ(ai,ak;bj,c)]
E(i,k)=E[I(i,k)]=∑jψ(ai,ak;bj,c)lnψ(ai,ak;bj,c)+(1−ψ(ai,ak;bj,c))ln[1−ψ(ai,ak;bj,c)]
Parameter tes dan kemampuan siswa tidak akan jatuh dari langit biru, tetapi mereka mudah diperkirakan dalam perangkat lunak modern seperti R dengan
atau paket serupa:{c,bj,j=1,2,…}{ai}lme4
irt <- glmer( answer ~ 1 + (1|student) + (1|question), family = binomial)
atau sesuatu yang sangat dekat dengan ini.