Model yang bermakna secara psikologis dapat membimbing kita.
Turunnya tes yang berguna
Setiap variasi dalam pengamatan dapat dikaitkan dengan variasi di antara subyek. Kita mungkin membayangkan bahwa setiap subjek, pada tingkat tertentu, muncul dengan nilai numerik untuk hasil metode 1 dan nilai numerik untuk hasil metode 2. Mereka kemudian membandingkan hasil ini. Jika keduanya cukup berbeda, subjek membuat pilihan yang pasti, tetapi sebaliknya subjek menyatakan dasi. (Ini terkait dengan keberadaan ambang diskriminasi .)
Variasi di antara subjek menyebabkan variasi dalam pengamatan eksperimental. Akan ada peluang tertentu untuk memilih metode 1, peluang tertentu untuk memilih metode 2, dan peluang tertentu untuk dasi.π1π2π0
Adalah adil untuk menganggap subjek merespons secara independen satu sama lain. Dengan demikian, kemungkinan mengamati subyek yang menyukai metode 1, subyek yang mendukung metode 2, dan subyek yang memberikan ikatan, bersifat multinomial . Terlepas dari konstanta normalisasi (tidak relevan), logaritma kemungkinan sama dengann1n2n0
n1log(π1)+n2log(π2)+n0log(π0).
Mengingat bahwa , ini dimaksimalkan ketika mana adalah jumlah subjek.π0+π1+π2=0πi=ni/nn=n0+n1+n2
Untuk menguji hipotesis nol bahwa kedua metode ini dianggap sama-sama baik, kami memaksimalkan kemungkinan dikenakan pembatasan yang disiratkan oleh hipotesis ini. Mengingat model psikologis dan permohonannya terhadap ambang hipotetis, kita harus hidup dengan kemungkinan bahwa (kemungkinan ikatan) adalah nol. Satu-satunya cara untuk mendeteksi kecenderungan lebih menyukai satu model daripada yang lain terletak pada bagaimana dan terpengaruh: jika model 1 disukai, maka harus meningkat dan berkurang, dan sebaliknya . Dengan asumsi variasi simetris , situasi tanpa preferensi terjadi ketikaπ0π1π2π1π2π1=π2 . (Ukuran akan memberi tahu kami sesuatu tentang ambang - tentang kemampuan diskriminatif - tetapi jika tidak memberikan informasi tentang preferensi.)π0
Ketika tidak ada model yang disukai, kemungkinan maksimum terjadi ketika dan, sekali lagi, . Menghubungkan dua solusi sebelumnya, kami menghitung perubahan dalam kemungkinan maksimum, :π1=π2=n1+n22/nπ0=n0/nG
G=(n1logn1n+n2logn2n+n0logn0n)−(n1log(n1+n2)/2n+n2log(n1+n2)/2n+n0logn0n)=n1log2n1n1+n2+n2log2n2n1+n2.
Ukuran nilai ini - yang tidak boleh negatif - memberi tahu kita seberapa kredibel hipotesis nol: ketika kecil, data "dijelaskan" hampir sama dengan hipotesis nol (restriktif) seperti pada umumnya; ketika nilainya besar, hipotesis nol kurang kredibel.G
Teori estimasi kemungkinan maksimum (asimptotik) mengatakan bahwa ambang batas yang masuk akal untuk perubahan ini adalah setengah dari quantile dari distribusi chi-square dengan satu derajat kebebasan (karena pembatasan tunggal dikenakan oleh hipotesis nol). Seperti biasa, adalah ukuran dari tes ini, sering dianggap 5% ( ) atau 1% ( ). sesuai adalah dan .1−απ1=π2α0.050.013.8414596.634897
Contoh
Misalkan dari subjek, metode nikmat 1 dan metode nikmat 2. Itu menyiratkan ada ikatan. Kemungkinan dimaksimalkan, untuk dan , di mana ia memiliki nilai . Di bawah hipotesis nol kemungkinan malah dimaksimalkan untuk , di mana nilainya hanya . Perbedaan adalah kurang dari satu-setengah threshold 5% dari . Karena itu kami melakukannyan=20n1=3n2=9n0=20−3−9=8π1=3/20=0.15π2=9/20=0.45−20.208…π1=π2=6/20=0.30−21.778G=−20.208−(−21.778)=1.57α=3.84tidak menolak hipotesis nol.
Tentang ikatan dan tes alternatif
Melihat kembali rumus untuk , perhatikan bahwa jumlah ikatan ( ) tidak muncul . Dalam contoh, jika kita telah mengamati subjek dan di antara mereka metode disukai 1, metode disukai 2, dan sisanya diikat, hasilnya akan sama.Gn0n=10039100−3−9=88
Memisahkan ikatan dan menetapkan setengah ke metode 1 dan setengah ke metode 2 secara intuitif masuk akal, tetapi menghasilkan tes yang kurang kuat . Misalnya, misalkan dan . Pertimbangkan dua kasus:n1=5n2=15
n=20 subjek, jadi ada ikatan. Tes kemungkinan maksimum akan menolak nol untuk nilai lebih besar dari . Tes lain yang sering digunakan dalam situasi ini (karena tidak ada ikatan) adalah tes binomial; itu akan menolak nol untuk setiap nilai lebih besar dari . Oleh karena itu dua tes biasanya akan memberikan hasil yang sama, karena nilai kritis ini cukup dekat.n0=0α0.02217α0.02660
n=100 subjek, jadi ada ikatan. Tes kemungkinan maksimum masih akan menolak nol untuk nilai lebih besar dari . Uji binomial akan menolak nol hanya untuk nilai lebih besar dari . Dua tes memberikan hasil yang sama sekali berbeda. Secara khusus, ikatan telah melemahkan kemampuan uji binomial untuk membedakan perbedaan yang disarankan teori kemungkinan maksimum adalah nyata.n0=80α0.02217α0.319780
Akhirnya, mari kita pertimbangkan pendekatan tabel kontingensi3×1 disarankan dalam jawaban lain. Pertimbangkan subjek dengan metode favorit 1, metode favorit 2, dan dengan ikatan. "Tabel" hanyalah vektor . Statistik chi-squared-nya adalah dengan dua derajat kebebasan. Nilai p adalah , yang akan menyebabkan kebanyakan orang menyimpulkan tidak ada perbedaan antara metode. Hasil kemungkinan maksimum sebagai gantinya memberikan nilai-p , yang akan menolak kesimpulan ini pada tingkat 5%.n=20n1=3n2=10n0=7(n0,n1,n2)=(7,3,10)3.70.15720.04614α=
Dengan subyek anggaplah bahwa hanya metode disukai 1, hanya metode disukai 2, dan ada ikatan. Secara intuitif ada sedikit bukti bahwa salah satu metode ini cenderung disukai. Tetapi kali ini statistik chi-kuadrat dari dengan jelas, tidak terbantahkan, (tapi sangat salah) menunjukkan ada perbedaan (nilai p kurang dari ).n=1001297182.4210−15
Dalam kedua situasi , pendekatan chi-squared mendapatkan jawaban yang sepenuhnya salah: dalam kasus pertama tidak memiliki kekuatan untuk mendeteksi perbedaan substansial sementara dalam kasus kedua (dengan banyak ikatan) sangat percaya diri tentang perbedaan yang tidak penting. Masalahnya bukan bahwa tes chi-squared itu buruk; masalahnya adalah ia menguji hipotesis yang berbeda: yaitu, apakah . Menurut model konseptual kami, hipotesis ini adalah omong kosong psikologis, karena ini membingungkan informasi tentang preferensi (yaitu, dan ) dengan informasi tentang ambang batas diskriminasi (yaitu, ). π1=π2=π0π1π2π0Ini adalah demonstrasi yang bagus tentang perlunya menggunakan konteks penelitian dan pengetahuan materi pelajaran (betapapun disederhanakan) dalam memilih tes statistik.