Apa perbedaan antara "uji statistik hipotesis nol" dan tes lainnya?

Sebuah topik diskusi hangat baru-baru ini menyangkut jurnal yang melarang penggunaan "prosedur pengujian statistik nol hipotesis (NHSTP)" dari artikel yang diajukan ke jurnal. Saya melihat istilah ini digunakan oleh beberapa penulis, tetapi saya tidak mengerti perbedaan apa yang mereka coba buat. Apakah NHSTP sesuatu yang berbeda dari "uji hipotesis" atau "uji signifikansi"?

hypothesis-testing statistical-significance terminology

— Russ Lenth
sumber

Singkatan yang agak lebih sering digunakan adalah NHST (tanpa P pada akhirnya). Kedua akronim tersebut tampaknya merupakan istilah yang merendahkan yang digunakan oleh penulis yang membencinya (dalam konteks polemik semacam itu). Anda dapat melirik pencarian Google Cendekia untuk NHST + null (hasil 1670, vs hanya 145 untuk NHSTP + null) - ini semua tentang masalah dan masalah dengan itu. Istilah merendahkan terkait lainnya adalah "ritual nol". Semua itu berarti apa yang Anda pikirkan artinya, tetapi diucapkan dengan jijik yang kuat!

— amoeba

Ada tes yang secara nisial sangat berbeda dari NHST yang lebih biasa, seperti tes kesetaraan - meskipun secara mekanis (tetapi tidak mengejutkan) mereka menggunakan kerangka kerja yang terkait erat. Namun, saya membayangkan editor jurnal tersebut mungkin juga akan menentangnya.

— Glen_b -Reinstate Monica

Terkait (tetapi bukan duplikat): Apa perbedaan antara "pengujian hipotesis" dan "uji signifikansi"? Juga, saya harus menunjukkan bahwa editor jurnal ini jelas tidak mencoba membuat perbedaan di antara semua itu! Mereka melarang semua jenis hipotesis / signifikansi / pengujian apa pun, baik itu Fisher, Neyman-Pearson, atau hibrida. Perbedaan ini hanya dibuat dalam konteks perang suci Fisher vs Neyman-Pearson (vs hybrid), yang bukan tentang larangan jurnal khusus ini.

— amoeba

Jadi, @Livid, Anda mengatakan bahwa "NHST" mengacu pada cara uji statistik biasanya digunakan dalam praktik, yang dibedakan dari paradigma Fisher dan NP? Saya kira itu, jika pada gilirannya itu menyiratkan memutar engkol yang rutin dan tanpa berpikir, maka saya akan setuju itu adalah istilah yang merendahkan.

— Russ Lenth

@rvl Inilah makalahnya (+ komentar) yang saya pikirkan sebelumnya: Precis dari signifikansi Statistik: Dasar Pemikiran, validitas, dan utilitas. Siu L. Chow. ILMU PERILAKU DAN OTAK (1998) 21, 169–239

— Livid

Latar Belakang: editorial yang dimaksud adalah ini salah satu dari Basic dan Psikologi Terapan Sosial , sebuah jurnal dengan faktor 2015 dampak 1,168, yaitu, tidak sangat yg boleh disebut.

Re: pertanyaan OP , yaitu, Apakah NHSTP sesuatu yang berbeda dari "tes hipotesis" atau "tes signifikansi"? Pernyataan editorial yang berlaku adalah

1) "...the null hypothesis significance testing procedure (NHSTP)  is invalid..." [Sic, with alpha = 0.05]
2) "...authors will have to remove all vestiges of the NHSTP (p-values, t-values, F-values, statements about ‘‘significant’’ differences or lack thereof, and so on)."
3) "...confidence intervals [Sic, 95%] also are banned from BASP."
4) "...Bayesian procedures are neither required nor banned from BASP." [Sic, depends on which ones, they are either banned or not.]
5) "Are any inferential statistical procedures required?...No..."

$p<.05$

Jawaban untuk OP: Para editor ini mungkin akan mengklaim tes signifikansi sering merupakan tes hipotesis yang tidak tepat. Sebagai contoh, mereka menyatakan bahwa "... proposal Bayesian yang setidaknya agak menghindari asumsi Laplacian [Sic, saya tidak tahu apa - apa a priori ] ... [sedemikian sehingga] bahkan mungkin ada kasus di mana ada alasan kuat untuk mengasumsikan bahwa angka benar-benar ada ... "Ini sebagian berhubungan dengan argumen Fisher versus Neyman dan Pearson seperti yang ditunjukkan di atas oleh @Livid dan yang editorialnya akan memihak Fisher.

Diskusi: Saya sangat percaya pada kerendahan hati intelektual sebagai prinsip fundamental, dan metode ilmiah yang sangat diperlukan. Jika saya, sebagai peneliti, tidak diizinkan untuk melanjutkan dari premis awal tanpa asumsi di mana semua teori sebelumnya tidak dipercaya, maka saya akan kehilangan semua kemampuan saya untuk memeriksa data dengan pikiran yang kreatif dan terbuka. Premis bahwa semua pemrosesan numerik harus menjadi kebenaran absolut adalah eksposisi cupiditas yang luhur. Satu-satunya kebenaran adalah data, dan saya akan dengan rendah hati mengutip Kotakdengan menyatakan bahwa semua model itu salah, terutama dan yang pasti anggapan bahwa kebenaran apa pun muncul dari apa pun yang tidak identik dengan data itu sendiri. Itu tidak berarti bahwa saya harus memilih antara Fisher dan Neyman / Pearson, lebih karena saya yakin tidak ada premis yang diambil sendiri, melainkan memeriksa hal-hal secara mendalam sampai hipotesis saya didukung dan / atau ditolak untuk konsistensi diri dari ensemble. Hanya konsistensi diri yang dapat digunakan sebagai kriteria, karena tidak ada analisis yang dapat mengungkapkan kebenaran absolut.

$p<0.05$ $0.05$ $0.001$ tidak akan meningkatkan konten jurnal.

— Carl
sumber

"... sebagai penyewa fundamental, dan sangat diperlukan metode ilmiah ..." - Saya berharap Anda berarti prinsip daripada penyewa .

— Glen_b -Reinstate Monica

@Glen_b Jeensens à vous remercier . Seharusnya aku tahu yang lebih baik, tetapi berharap semua itu salah. Ergo , untuk sisanya, ada pemikiran?

— Carl