1. Sebuah contoh terkenal dalam psikologi dan linguistik dijelaskan oleh Herb Clark (1973; mengikuti Coleman, 1964): "Kekeliruan bahasa sebagai efek tetap: Kritik statistik bahasa dalam penelitian psikologis."
Clark adalah seorang psikolog yang membahas eksperimen psikologis di mana sampel subjek penelitian membuat tanggapan terhadap serangkaian bahan stimulus, umumnya berbagai kata yang diambil dari beberapa corpus. Dia menunjukkan bahwa prosedur statistik standar yang digunakan dalam kasus-kasus ini, berdasarkan ANOVA tindakan berulang, dan disebut oleh Clark sebagai , memperlakukan peserta sebagai faktor acak tetapi (mungkin secara implisit) memperlakukan bahan stimulus (atau "bahasa") sebagai tetap. Hal ini menyebabkan masalah dalam menginterpretasikan hasil tes hipotesis pada faktor kondisi eksperimental: tentu saja kami ingin mengasumsikan bahwa hasil positif memberi tahu kita sesuatu tentang kedua populasi dari mana kami menarik sampel peserta kami serta populasi teoritis dari mana kami menggambar materi bahasa. TapiF1F1, dengan memperlakukan peserta secara acak dan rangsangan sebagai tetap, hanya memberi tahu kita tentang pengaruh faktor kondisi di antara peserta serupa lainnya yang menanggapi rangsangan yang sama persis . Melakukan analisis ketika peserta dan rangsangan lebih tepat dipandang sebagai acak dapat menyebabkan tingkat kesalahan Tipe 1 yang secara substansial melebihi tingkat nominal - biasanya 0,05 - dengan tingkat tergantung pada faktor-faktor seperti jumlah dan variabilitas dari rangsangan dan desain percobaan. Dalam kasus-kasus ini, analisis yang lebih tepat, setidaknya di bawah kerangka kerja ANOVA klasik, adalah dengan menggunakan apa yang disebut statistik quasi- berdasarkan rasio kombinasi linear kuadrat rata - rata.F1αF
Makalah Clark membuat percikan dalam psikolinguistik pada saat itu, tetapi gagal membuat penyok besar dalam literatur psikologis yang lebih luas. (Dan bahkan dalam psikolinguistik nasihat Clark menjadi agak terdistorsi selama bertahun-tahun, seperti yang didokumentasikan oleh Raaijmakers, Schrijnemakers, & Gremmen, 1999). Tetapi dalam beberapa tahun terakhir masalah ini telah melihat sesuatu yang membangkitkan kembali, sebagian besar karena kemajuan statistik dalam model efek campuran, di mana model campuran klasik ANOVA dapat dilihat sebagai kasus khusus. Beberapa makalah baru-baru ini termasuk Baayen, Davidson, & Bates (2008), Murayama, Sakaki, Yan, & Smith (2014), dan ( ahem ) Judd, Westfall, & Kenny (2012). Saya yakin ada beberapa yang saya lupa.
2. Tidak tepat. Ada yang metode mendapatkan apakah faktor lebih baik dimasukkan sebagai efek acak atau tidak dalam model sama sekali (lihat misalnya, Pinheiro & Bates, 2000, hlm 83-87;. Namun melihat Barr, Levy, Scheepers, & Tily, 2013). Dan tentu saja ada teknik perbandingan model klasik untuk menentukan apakah suatu faktor lebih baik dimasukkan sebagai efek tetap atau tidak sama sekali (yaitu,uji-). Tetapi saya berpikir bahwa menentukan apakah suatu faktor lebih baik dianggap sebagai tetap atau acak umumnya lebih baik dibiarkan sebagai pertanyaan konseptual, harus dijawab dengan mempertimbangkan desain penelitian dan sifat kesimpulan yang dapat ditarik darinya.F
Salah satu instruktur statistik pascasarjana saya, Gary McClelland, suka mengatakan bahwa mungkin pertanyaan mendasar dari inferensi statistik adalah: "Dibandingkan dengan apa?" Mengikuti Gary, saya pikir kita dapat membingkai pertanyaan konseptual yang saya sebutkan di atas sebagai: Apa kelas referensi dari hasil eksperimen hipotetis yang ingin saya bandingkan dengan hasil pengamatan saya yang sebenarnya? Tetap dalam konteks psikolinguistik, dan mempertimbangkan desain eksperimental di mana kami memiliki sampel Subjek menanggapi sampel Kata-kata yang diklasifikasikan dalam satu dari dua Kondisi (desain khusus yang dibahas panjang lebar oleh Clark, 1973), saya akan fokus pada dua kemungkinan:
- Serangkaian eksperimen di mana, untuk setiap percobaan, kami menggambar sampel Subjek baru, sampel Kata baru, dan sampel kesalahan baru dari model generatif. Di bawah model ini, Subjek dan Kata-kata keduanya efek acak.
- Himpunan percobaan di mana, untuk setiap percobaan, kami menggambar sampel Subjek baru, dan sampel kesalahan baru, tetapi kami selalu menggunakan kumpulan Kata yang sama . Di bawah model ini, Subjek adalah efek acak tetapi Kata-kata adalah efek tetap.
Untuk membuat ini benar-benar konkret, di bawah ini adalah beberapa plot dari (di atas) 4 set hasil hipotesis dari 4 percobaan disimulasikan di bawah Model 1; (di bawah) 4 set hasil hipotetis dari 4 percobaan disimulasikan di bawah Model 2. Setiap percobaan melihat hasilnya dalam dua cara: (panel kiri) dikelompokkan berdasarkan Subjek, dengan Subjek Berdasarkan Kondisi berarti diplot dan diikat bersama untuk masing-masing Subjek; (panel kanan) dikelompokkan berdasarkan Kata-kata, dengan plot kotak yang merangkum distribusi tanggapan untuk setiap kata. Semua percobaan melibatkan 10 Subjek yang menanggapi 10 Kata, dan dalam semua percobaan "hipotesis nol" tanpa perbedaan kondisi adalah benar dalam populasi yang relevan.
Subjek dan Kata keduanya acak: 4 percobaan disimulasikan
Perhatikan di sini bahwa dalam setiap percobaan, profil respons untuk Subjek dan Kata-kata sangat berbeda. Untuk Subjek, kami terkadang mendapatkan responden keseluruhan rendah, terkadang responden tinggi, kadang-kadang Subjek yang cenderung menunjukkan perbedaan Kondisi yang besar, dan kadang-kadang Subjek yang cenderung menunjukkan perbedaan Kondisi kecil. Demikian pula, untuk Kata-kata, kita terkadang mendapatkan Kata-kata yang cenderung mendapat respons rendah, dan terkadang mendapatkan Kata-kata yang cenderung mendapat respons tinggi.
Subjek acak, Kata-kata tetap: 4 percobaan disimulasikan
Perhatikan di sini bahwa di seluruh 4 percobaan simulasi, Subjek terlihat berbeda setiap saat, tetapi profil respons untuk Kata-kata pada dasarnya terlihat sama, konsisten dengan asumsi bahwa kami menggunakan kembali rangkaian Kata yang sama untuk setiap percobaan dalam model ini.
Pilihan kami apakah kami menganggap Model 1 (Subjek dan Kata-kata acak) atau Model 2 (Subjek acak, Kata-kata tetap) memberikan kelas referensi yang sesuai untuk hasil eksperimen yang kami amati dapat membuat perbedaan besar pada penilaian kami apakah manipulasi kondisi "bekerja." Kami mengharapkan lebih banyak variasi peluang dalam data di bawah Model 1 daripada di bawah Model 2, karena ada lebih banyak "komponen bergerak". Jadi jika kesimpulan yang ingin kita tarik lebih konsisten dengan asumsi Model 1, di mana variabilitas peluang relatif lebih tinggi, tetapi kami menganalisis data kami di bawah asumsi Model 2, di mana variabilitas peluang relatif lebih rendah, maka kesalahan Tipe 1 kami tingkat untuk menguji perbedaan Kondisi akan meningkat hingga beberapa (mungkin cukup besar). Untuk informasi lebih lanjut, lihat Referensi di bawah ini.
Referensi
Baayen, RH, Davidson, DJ, & Bates, DM (2008). Pemodelan efek campuran dengan efek acak silang untuk subjek dan item. Jurnal memori dan bahasa, 59 (4), 390-412. PDF
Barr, DJ, Levy, R., Scheepers, C., & Tily, HJ (2013). Struktur efek acak untuk pengujian hipotesis konfirmasi: Jaga agar tetap maksimal. Jurnal Memori dan Bahasa, 68 (3), 255-278. PDF
Clark, HH (1973). Kekeliruan sebagai efek tetap: Kritik terhadap statistik bahasa dalam penelitian psikologis. Jurnal pembelajaran verbal dan perilaku verbal, 12 (4), 335-359. PDF
Coleman, EB (1964). Generalisasi ke populasi bahasa. Laporan Psikologis, 14 (1), 219-226.
Judd, CM, Westfall, J., & Kenny, DA (2012). Memperlakukan rangsangan sebagai faktor acak dalam psikologi sosial: solusi baru dan komprehensif untuk masalah yang meluas tetapi sebagian besar diabaikan. Jurnal kepribadian dan psikologi sosial, 103 (1), 54. PDF
Murayama, K., Sakaki, M., Yan, VX, & Smith, GM (2014). Inflasi Kesalahan Tipe I dalam Analisis Tradisional Oleh-Peserta ke Akurasi Metamem: Sebuah Perspektif Model Efek Campuran Umum. Jurnal Psikologi Eksperimental: Belajar, Memori, dan Kognisi. PDF
Pinheiro, JC, & Bates, DM (2000). Model efek campuran di S dan S-PLUS. Peloncat.
Raaijmakers, JG, Schrijnemakers, J., & Gremmen, F. (1999). Cara menangani "kekeliruan bahasa sebagai efek tetap": Kesalahpahaman umum dan solusi alternatif. Jurnal Memori dan Bahasa, 41 (3), 416-426. PDF