Pengujian hipotesis versus estimasi parameter
Biasanya, hipotesis dibingkai dengan cara biner. Saya akan meletakkan hipotesis arah ke satu sisi, karena mereka tidak banyak mengubah masalah. Adalah umum, setidaknya dalam psikologi, untuk berbicara tentang hipotesis seperti: perbedaan antara rata-rata kelompok adalah atau tidak nol; korelasinya adalah atau tidak nol; koefisien regresi adalah atau tidak nol; r-square adalah atau tidak nol. Dalam semua kasus ini, ada hipotesis nol tidak berpengaruh, dan hipotesis alternatif efek.
Pemikiran biner ini umumnya bukan hal yang paling menarik bagi kami. Setelah Anda memikirkan pertanyaan penelitian Anda, Anda akan hampir selalu menemukan bahwa Anda sebenarnya tertarik dalam memperkirakan parameter. Anda tertarik pada perbedaan aktual antara rata-rata kelompok, atau ukuran korelasi, atau ukuran koefisien regresi, atau jumlah perbedaan yang dijelaskan.
Tentu saja, ketika kita mendapatkan sampel data, perkiraan sampel suatu parameter tidak sama dengan parameter populasi. Jadi kita perlu cara untuk mengukur ketidakpastian kita tentang apa nilai parameternya. Dari sudut pandang yang sering, interval kepercayaan menyediakan cara untuk melakukan, meskipun puritan Bayesian mungkin berpendapat bahwa mereka tidak secara ketat mengizinkan kesimpulan yang mungkin ingin Anda buat. Dari perspektif Bayesian, interval kredibel pada kepadatan posterior memberikan cara yang lebih langsung untuk mengukur ketidakpastian Anda tentang nilai parameter populasi.
Parameter / ukuran efek
R2
Ada literatur besar dalam bidang psikologi (dan bidang lainnya) yang mengkritik fokus pada nilai-p, pengujian signifikansi nol hipotesis, dan sebagainya (lihat pencarian Google Cendekia ini ). Literatur ini sering merekomendasikan ukuran efek pelaporan dengan interval kepercayaan sebagai resolusi (misalnya, gugus tugas APA oleh Wilkinson, 1999).
Langkah-langkah untuk menjauh dari pengujian hipotesis biner
Jika Anda berpikir untuk mengadopsi pemikiran ini, saya pikir ada pendekatan yang semakin canggih yang dapat Anda ambil:
- Pendekatan 1a. Laporkan estimasi titik efek sampel Anda (misalnya, perbedaan rata-rata grup) dalam istilah baku dan standar. Ketika Anda melaporkan hasil Anda, diskusikan apa artinya sebesar itu bagi teori dan praktik.
- Pendekatan 1b. Tambahkan ke 1a, setidaknya pada tingkat yang sangat dasar, beberapa perasaan ketidakpastian di sekitar estimasi parameter Anda berdasarkan ukuran sampel Anda.
- Pendekatan 2. Juga laporkan interval kepercayaan pada ukuran efek dan gabungkan ketidakpastian ini ke dalam pemikiran Anda tentang nilai-nilai yang masuk akal dari parameter bunga.
- Pendekatan 3. Laporkan interval Bayesian yang kredibel, dan periksa implikasi berbagai asumsi pada interval yang kredibel, seperti pilihan sebelumnya, proses pembuatan data yang tersirat oleh model Anda, dan sebagainya.
Di antara banyak referensi yang mungkin, Anda akan melihat Andrew Gelman berbicara banyak tentang masalah ini di blognya dan dalam penelitiannya.
Referensi
- Nickerson, RS (2000). Pengujian signifikansi hipotesis nol: tinjauan terhadap kontroversi lama dan berkelanjutan. Metode psikologis, 5 (2), 241.
- Wilkinson, L. (1999). Metode statistik dalam jurnal psikologi: pedoman dan penjelasan. Psikolog Amerika, 54 (8), 594. PDF