Bahkan, nilai-p sekarang akhirnya 'ketinggalan zaman' juga: http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 . Pengujian signifikansi nol hipotesis (NHST) menghasilkan sedikit lebih dari deskripsi ukuran sampel Anda. (*) Setiap intervensi eksperimental akan memiliki beberapa efek, yang mengatakan bahwa hipotesis nol sederhana 'tidak ada efek' selalu salah dalam arti yang ketat . Oleh karena itu, tes 'tidak signifikan' hanya berarti bahwa ukuran sampel Anda tidak cukup besar; tes 'signifikan' berarti Anda mengumpulkan cukup data untuk 'menemukan' sesuatu.
'Ukuran efek' mewakili upaya untuk memperbaiki ini, dengan memperkenalkan ukuran pada skala alami masalah. Dalam kedokteran, di mana perawatan selalu memiliki beberapa efek (bahkan jika itu adalah efek plasebo), gagasan tentang 'efek yang bermakna secara klinis' diperkenalkan untuk menjaga terhadap kemungkinan 50% sebelumnya bahwa 'pengobatan' akan ditemukan memiliki 'a ( secara statistik) efek positif yang signifikan '(namun sangat kecil) dalam penelitian besar yang sewenang-wenang.
Jika saya memahami sifat pekerjaan Anda, Clarinetist, maka pada akhirnya, tujuan sahnya adalah untuk menginformasikan tindakan / intervensi yang meningkatkan pendidikan di sekolah-sekolah di bawah lingkup Anda. Dengan demikian, pengaturan Anda adalah teoretikus keputusan , dan metode Bayesian adalah pendekatan yang paling tepat (dan unik [1] ).
Memang, cara terbaik untuk memahami metode yang sering digunakan adalah sebagai pendekatan terhadap metode Bayesian . Perkiraan ukuran efek dapat dipahami sebagai bertujuan pada ukuran sentralitas untuk distribusi posterior Bayesian , sedangkan nilai-p dapat dipahami sebagai bertujuan untuk mengukur satu ekor posterior itu. Jadi, secara bersama - sama kedua kuantitas ini mengandung beberapa inti kasar dari posterior Bayesian yang merupakan input alami untuk pandangan teoretis keputusan tentang masalah Anda. (Atau, interval kepercayaan sering pada ukuran efek dapat dipahami juga sebagai interval kredibel wannabe .)
Di bidang psikologi dan pendidikan, metode Bayesian sebenarnya cukup populer. Salah satu alasannya adalah mudah untuk menginstal 'konstruk' ke dalam model Bayesian, sebagai variabel laten. Anda mungkin ingin melihat 'buku anak anjing' oleh John K. Kruschke , seorang psikolog. Dalam pendidikan (di mana Anda memiliki siswa yang bersarang di ruang kelas, bersarang di sekolah, bersarang di distrik, ...), pemodelan hierarkis tidak dapat dihindari. Dan model Bayesian juga bagus untuk pemodelan hierarkis. Pada akun ini, Anda mungkin ingin memeriksa Gelman & Hill [2].
[1]: Robert, Christian P. The Bayesian Choice: Dari Yayasan Decision-Theoretic hingga Implementasi Komputasi. 2nd ed. Teks Springer dalam Statistik. New York: Springer, 2007.
[2]: Gelman, Andrew, dan Jennifer Hill. Analisis Data Menggunakan Regresi dan Model Bertingkat / hierarkis. Metode Analisis untuk Penelitian Sosial. Cambridge; New York: Cambridge University Press, 2007.
Untuk informasi lebih lanjut tentang 'koherensi' dari perspektif bata-Bayesian yang tidak perlu mengalahkan Anda di kepala , lihat [3].
[3]: Robins, James, dan Larry Wasserman. “Pengkondisian, Kemungkinan, dan Koherensi: Tinjauan atas Beberapa Konsep Dasar.” Jurnal Asosiasi Statistik Amerika 95, no. 452 (1 Desember 2000): 1340–46. doi: 10.1080 / 01621459.2000.10474344.
(*) Dalam [4], Meehl membuat NHST jauh lebih elegan, tetapi tidak kalah abrasif, daripada yang saya lakukan:
Karena hipotesis nol adalah selalu kuasi-selalu salah, tabel yang merangkum penelitian dalam hal pola "perbedaan signifikan" sedikit lebih dari hasil fungsi fungsi statistik yang kompleks dan tidak dapat diinterpretasikan secara kausal.
[4]: Meehl, Paul E. "Risiko Teoritis dan Asterisk Tabular: Sir Karl, Sir Ronald, dan Kemajuan Lambat Psikologi Lunak." Jurnal Konsultasi dan Psikiatri Klinis 46 (1978): 806-34. http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf
Dan inilah kutipan terkait dari Tukey: /stats//a/728/41404