Meskipun saya merasa sedikit malu-malu bertentangan dengan "teks yang disegani" maupun pengguna CV lainnya, bagi saya tampaknya formula Spearman-Brown tidak terpengaruh oleh item yang memiliki kesulitan yang berbeda. Yang pasti, rumus Spearman-Brown biasanya diturunkan dengan asumsi bahwa kita memiliki item paralel , yang menyiratkan (antara lain) bahwa item memiliki kesulitan yang sama. Tetapi ternyata anggapan ini tidak perlu; itu bisa santai untuk memungkinkan kesulitan yang tidak setara, dan formula Spearman-Brown masih akan berlaku. Saya menunjukkan ini di bawah.
Ingatlah bahwa dalam teori uji klasik, pengukuran dianggap sebagai jumlah dari komponen "skor sebenarnya" dan komponen kesalahan , yaitu,
dengan dan tidak berkorelasi. Asumsi item paralel adalah bahwa semua item memiliki skor sebenarnya yang sama, hanya berbeda dalam komponen kesalahan mereka, meskipun ini diasumsikan memiliki varian yang sama. Dalam simbol, untuk setiap pasangan item dan ,
XTE
X=T+E,
TEXX′T=T′var(E)=var(E′).
Mari kita lihat apa yang terjadi ketika kita mengendurkan asumsi pertama, sehingga item mungkin berbeda dalam kesulitan mereka, dan kemudian memperoleh keandalan skor tes total berdasarkan asumsi baru ini. Secara khusus, asumsikan bahwa skor sebenarnya mungkin berbeda dengan konstanta aditif, tetapi kesalahan masih memiliki varian yang sama. Dalam simbol,
Setiap perbedaan dalam kesulitan ditangkap oleh konstanta aditif. Misalnya, jika , maka skor pada cenderung lebih tinggi dari skor pada , sehingga "lebih mudah" daripada . Kita mungkin menyebut ini
pada dasarnya paralelT=T′+c′var(E)=var(E′).
c′>0XX′XX′item, dalam analogi dengan asumsi "esensial tau-ekuivalensi" yang merilekskan model setara tau dengan cara yang sama.
Sekarang untuk mendapatkan keandalan bentuk tes dari barang-barang tersebut. Pertimbangkan tes yang terdiri dari item paralel dasarnya, jumlah yang memberikan skor tes. Reliabilitas adalah, menurut definisi, rasio varian skor sejati dengan varian skor yang diamati. Untuk keandalan masing-masing item, itu mengikuti dari definisi paralelisme esensial bahwa mereka memiliki keandalan yang sama, yang kami tunjukkan dengan , dengan menjadi varian skor sebenarnya dan varian kesalahan. Untuk keandalan skor tes total, pertama-tama kita menguji varians dari skor tes total, yaitu
kρ=σ2T/(σ2T+σ2E)σ2Tσ2E Tσ 2 T σ 2 E k 2 σ 2 T
var(∑i=1kTi+Ei)=var(∑i=1kT+ci+Ei)=k2σ2T+kσ2E,
mana (tidak ada subskrip) adalah skor benar sembarang yang semua skor sebenarnya semua item dapat diubah menjadi melalui persyaratan konstannya, adalah varians skor sebenarnya, dan adalah varians kesalahan. Perhatikan bahwa syarat konstan putus! Ini kuncinya. Jadi reliabilitas dari total skor tes adalah
Tσ2Tσ2Ek2σ2Tk2σ2T+kσ2E=kσ2Tkσ2T+σ2X−σ2T=kρ1+(k−1)ρ,
yang hanya formula klasik Spearman-Brown, tidak berubah. Apa ini menunjukkan bahwa bahkan ketika memvariasikan "kesulitan" dari item, didefinisikan sebagai skor rata-rata, rumus Spearman-Brown masih berlaku.
@JeremyMiles mengangkat beberapa poin menarik dan penting tentang apa yang bisa terjadi ketika kita meningkatkan panjang tes "di dunia nyata," tetapi setidaknya menurut asumsi ideal teori tes klasik, variasi dalam kesulitan item tidak masalah untuk keandalan suatu bentuk tes (sangat kontras dengan asumsi Item Response Theory!). Garis dasar penalaran yang sama ini juga mengapa kita biasanya berbicara tentang tau-kesetaraan esensial daripada tau-kesetaraan, karena sebagian besar semua hasil penting berlaku untuk kasus yang lebih lunak di mana kesulitan item (yaitu, sarana) dapat berbeda.