Nilai-P dalam uji dua-ekor dengan distribusi nol asimetris

Situasi saya adalah sebagai berikut: Saya ingin, melalui studi Monte-Carlo, untuk membandingkan nilai dari dua tes yang berbeda untuk signifikansi statistik dari parameter yang diestimasi (nol adalah "tidak ada efek - parameter nol", dan alternatif yang tersirat adalah " parameter tidak nol "). Uji A adalah standar "uji dua sampel independen untuk persamaan rata-rata" , dengan varian yang sama di bawah nol. $p$

Tes B Saya telah membuat sendiri. Di sini, distribusi nol yang digunakan adalah distribusi diskrit generik asimetris . Tetapi saya telah menemukan komentar berikut dalam Rohatgi & Saleh (2001, 2nd ed, p. 462)

"Jika distribusinya tidak simetris, nilai -tidak didefinisikan dengan baik dalam kasus dua sisi, meskipun banyak penulis merekomendasikan menggandakan nilai satu sisi " $p$ $p$ .

Para penulis tidak membahas ini lebih lanjut, juga tidak mengomentari "banyak penulis saran" untuk melipatgandakan satu sisi -nilai. (Ini menciptakan pertanyaan "gandakan nilai dari sisi mana ? Dan mengapa sisi ini dan bukan sisi yang lain?) $p$ $p$

Saya tidak dapat menemukan komentar, pendapat, atau hasil lain tentang masalah ini. Saya mengerti bahwa dengan distribusi asimetris meskipun kita dapat mempertimbangkan interval simetris di sekitar hipotesis nol mengenai nilai parameter, kita tidak akan memiliki simetri biasa kedua, yaitu probabilitas alokasi massa. Tapi saya tidak mengerti mengapa ini membuat -value "tidak didefinisikan dengan baik". Secara pribadi, dengan menggunakan interval simetris di sekitar hipotesis nol untuk nilai-nilai estimator saya tidak melihat definisi $p$ masalah dalam mengatakan "probabilitas bahwa distribusi nol akan menghasilkan nilai yang sama dengan batas, atau di luar interval ini adalah XX". Fakta bahwa massa probabilitas di satu sisi akan berbeda dari massa probabilitas di sisi lain, tampaknya tidak menimbulkan masalah, setidaknya untuk tujuan saya. Tapi itu lebih mungkin daripada tidak Rohatgi & Saleh tahu sesuatu yang tidak saya ketahui.

Jadi ini adalah pertanyaan saya: Dalam arti apa nilai- (atau bisa) "tidak didefinisikan dengan baik" dalam kasus tes dua sisi ketika distribusi nol tidak simetris? $p$

Mungkin catatan penting: Saya lebih mendekati masalah ini dalam semangat Nelayan, saya tidak mencoba untuk mendapatkan aturan keputusan yang ketat dalam pengertian Neyman-Pearson. Saya serahkan kepada pengguna tes untuk menggunakan informasi value bersama informasi lain untuk membuat kesimpulan. $p$

hypothesis-testing p-value

— Alecos Papadopoulos
sumber

Selain pendekatan berbasis-kemungkinan ("Nelayan") dan berbasis-LR (NP), metode lain mempertimbangkan cara mendapatkan interval kepercayaan pendek dan menggunakannya untuk pengujian hipotesis. Ini dilakukan dalam semangat teori keputusan (dan menggunakan metodenya), di mana panjang termasuk dalam fungsi kerugian. Untuk distribusi simetris unimodal dari statistik uji, jelas interval sesingkat mungkin diperoleh dengan menggunakan interval simetris (pada dasarnya "menggandakan nilai p" dari tes satu sisi). Interval panjang terpendek tergantung pada parameterisasi: sehingga mereka tidak bisa menjadi nelayan.

— whuber

Saya bertanya-tanya apakah jawaban yang diposting di sini juga berlaku pada distribusi beta. Terima kasih.

— JLT

@JLT: Ya, mengapa tidak?

— Scortchi

Jawaban:

Jika kita melihat uji pasti 2x2, dan menganggap itu sebagai pendekatan kita, apa yang "lebih ekstrem" mungkin langsung diukur dengan 'kemungkinan rendah'. (Agresti [1] menyebutkan sejumlah pendekatan oleh berbagai penulis untuk menghitung dua nilai-p hanya untuk kasus uji eksak 2x2 Fisher ini, di mana pendekatan ini adalah salah satu dari tiga pendekatan yang secara khusus dibahas sebagai 'paling populer'.)

Untuk distribusi kontinu (unimodal), Anda hanya menemukan titik di ekor lainnya dengan kepadatan yang sama dengan nilai sampel Anda, dan segala sesuatu dengan kemungkinan yang sama atau lebih rendah di ekor lainnya dihitung dalam perhitungan nilai-p Anda.

Untuk distribusi diskrit yang secara monoton tidak meningkat di bagian ekor, itu hanya sesederhana itu. Anda hanya menghitung semuanya dengan kemungkinan yang sama atau lebih rendah dari sampel Anda, yang memberikan asumsi yang saya tambahkan (agar istilah "ekor" sesuai dengan gagasan itu), memberikan cara untuk menyelesaikannya.

Jika Anda terbiasa dengan interval HPD (dan sekali lagi, kita berhadapan dengan unimodality), itu pada dasarnya seperti mengambil segala sesuatu di luar interval HPD terbuka yang dibatasi satu ekor oleh statistik sampel Anda.

masukkan deskripsi gambar di sini

[Untuk mengulangi - ini adalah kemungkinan di bawah nol yang kami samakan di sini.]

Jadi setidaknya dalam kasus unimodal, tampaknya cukup sederhana untuk meniru tes Fisher yang tepat dan masih berbicara tentang dua ekor.

Namun, Anda mungkin tidak bermaksud memohon semangat uji pasti Fisher dengan cara ini.

$\alpha$

Pendekatan ini dapat berharga bahkan jika seseorang melakukan tes di luar tes rasio kemungkinan yang biasa. Untuk beberapa aplikasi, mungkin sulit untuk mengetahui bagaimana menghitung nilai-p dalam tes permutasi asimetris ... tetapi seringkali menjadi jauh lebih sederhana jika Anda berpikir tentang aturan penolakan terlebih dahulu.

Dengan uji-F varians, saya perhatikan bahwa "nilai p satu ekor ganda" dapat memberikan nilai p yang sangat berbeda dengan apa yang saya lihat sebagai pendekatan yang tepat. [Tidak masalah kelompok mana yang Anda sebut "sampel 1", atau apakah Anda memasukkan varians yang lebih besar atau lebih kecil di pembilang.]

[1]: Agresti, A. (1992),
Sebuah Survei Inferensi Tepat untuk Tabel Kontinjensi
Ilmu Statistik , Vol. 7 , No. 1. (Februari), hlm. 131-153.

— Glen_b -Reinstate Monica
sumber

ctd ... Jika kita melakukan uji rasio kemungkinan, rasio kemungkinan selalu satu sisi, tetapi jika kita membangun uji dua sisi yang setara berdasarkan beberapa statistik maka kita masih mencari rasio kemungkinan yang lebih kecil untuk menemukan "lebih ekstrim"

— Glen_b -Reinstate Monica

Menggandakan nilai-satu-ekor mungkin dipertahankan sebagai koreksi Bonferroni untuk melakukan dua tes satu-ekor. Setelah semua, mengikuti tes dua sisi, kami biasanya sangat cenderung menganggap keraguan yang dilemparkan pada kebenaran nol sebagai mendukung hipotesis lain yang arahnya ditentukan oleh data.

— Scortchi

@Alecos itu cukup sederhana untuk membenarkan pilihan simetris! Saya merasa sulit untuk melihat bagaimana Anda akan membaca apa yang saya tulis sebagai menyarankan pilihan simetris adalah dengan cara apa pun bukan hal yang sah untuk dilakukan (pilihan itu ditutupi oleh diskusi yang saya berikan tentang aturan penolakan - Anda dapat dengan mudah membangun simetris aturan penolakan). Bagian pertama dari jawaban saya adalah menanggapi bagian dalam pertanyaan tentang Fisher. Jika Anda bertanya tentang Fisher, haruskah saya tidak mendiskusikan apa yang mungkin dilakukan Fisher, berdasarkan apa yang ia lakukan dalam keadaan yang sama? Anda tampaknya menafsirkan respons saya sebagai mengatakan lebih dari itu.

— Glen_b -Reinstate Monica

@Alecos Secara khusus, saya tidak menganjurkan pendekatan Fisher, atau Neyman Pearson (apakah kita berbicara tentang tes rasio kemungkinan atau hanya tes hipotesis lebih umum), juga tidak boleh Anda menganggap saya sebagai mencoba untuk menyarankan bahwa segala sesuatu yang saya telah hilangkan mungkin salah . Saya hanya membahas sejumlah hal yang sepertinya Anda angkat dalam pertanyaan Anda.

— Glen_b -Reinstate Monica

Akhirnya, ya. Hal yang rapi tentang pendekatan Fisher adalah memberikan cara yang sangat masuk akal untuk mencapai nilai p tanpa bahkan memiliki alternatif. Tetapi jika Anda memang memiliki alternatif minat tertentu, Anda dapat menargetkan wilayah penolakan Anda lebih atau kurang tepat untuk alternatif tersebut dengan mendeklarasikan bagian-bagian ruang sampel di mana alternatif akan cenderung menempatkan sampel Anda sebagai wilayah penolakan. Statistik uji, T, adalah cara yang mudah untuk mencapainya, pada dasarnya dengan mengaitkan satu angka dengan setiap titik di dalamnya (memberi kita 'lebih ekstrem' seperti yang diukur dengan T). ...

— ctd

$S$ $T$ $S$ $T=|S|$

$t=\min(\Pr_{H_0}(S<s),\Pr_{H_0}(S>s))$ $S$ $2t$

$S$ $S$ $T=f_S(S)$ $X$ $1.66$ $-1.66$

hal = Pr (X > 1.66) + Pr (X < - 1.66) = 0,048457 + 0,048457 = 0,09691.

$p=\Pr(X > 1.66) +\Pr(X<-1.66)=0.048457+0.048457=0.09691.$

Y

$Y$

e^{1.66} = 5.2593

$\mathrm{e}^{1.66}=5.2593$

0.025732

$0.025732$

= e^{- 3.66}

$=\mathrm{e}^{-3.66}$

hal = Pr (Y > 5.2593) + Pr (Y < 0,025732) = 0,048457 + 0,00012611 = 0,04858.

$p=\Pr(Y>5.2593) +\Pr(Y<0.025732)=0.048457+0.00012611=0.04858.$

\begin{aligned} p = 2 t & = 2 min (Pr (X < 1.66), Pr (X > 1.66)) \\ = 2 min (Pr (Y < 5.2593), Pr (Y > 5.2593)) \\ = 2 min (0.048457, 0.951543) \\ = 2 \times 0.048457 = 0.09691. \end{aligned}

$\begin{align}p=2t&=2\min(\Pr(X<1.66),\Pr(X>1.66))\\&=2\min(\Pr(Y<5.2593),\Pr(Y>5.2593))\\&=2\min(0.048457,0.951543)\\&=2\times 0.048457=0.09691.\end{align}$

Semacam lanjutan dari jawaban ini, membahas beberapa prinsip konstruksi pengujian di mana hipotesis alternatif dinyatakan secara eksplisit, dapat ditemukan di sini .

$S$

p_{L} = \underset{H_{0}}{Pr} (S \leq s)

$p_\mathrm{L} = \Pr_{H_0}(S\leq s)$

p_{U} = \underset{H_{0}}{Pr} (S \geq s)

$p_\mathrm{U} = \Pr_{H_0}(S\geq s)$

untuk nilai-p satu-ekor yang lebih rendah & atas, nilai-dua-ekor diberikan oleh

Pr (T \leq t) = {\begin{cases} p_{L} + \underset{H_{0}}{Pr} (P_{U} \leq p_{L}) & when p_{L} \leq p_{U} \\ p_{U} + \underset{H_{0}}{Pr} (P_{L} \leq p_{U}) & otherwise \end{cases}

$\Pr(T\leq t) = \begin{cases} p_\mathrm{L} + \Pr_{H_0}(P_\mathrm{U} \leq p_\mathrm{L}) & \text{when}\ p_\mathrm{L} \leq p_\mathrm{U}\\ p_\mathrm{U} + \Pr_{H_0}(P_\mathrm{L} \leq p_\mathrm{U}) & \text{otherwise} \end{cases}$

$2t$

— Scortchi - Reinstate Monica
sumber

Oh wow. Ini adalah poin yang sangat bagus, +1. Lalu apa saran Anda? Juga, dapatkah saya mengartikan perbedaan ini sesuai dengan pilihan statistik uji yang berbeda (dalam hal ini implisit)?

— Amuba mengatakan Reinstate Monica

@amoeba: Bukan salah ketik! Dan ketika Anda mengamati 1,66 Anda mengambil minimum 0,952 & 0,048. Jika Anda benar-benar mengamati -3,66 itu akan menjadi minimum 0,0001 & 0,9999.

— Scortchi

@Scortchi Saya baru saja menerima jawaban Glen_b karena itu lebih "berguna" bagi saya dalam arti sempit. Tetapi milik Anda membantu saya menghindari jebakan berpikir bahwa "hanya itu yang ada di sana", yang merupakan polis asuransi yang sangat baik untuk risiko di masa depan. Terima kasih lagi.

— Alecos Papadopoulos

@Scortchi Saya harus setuju; tanggapan saya mengambil pandangan yang agak sederhana dan sepihak, dan saya harus memenuhi syarat, memperluas dan membenarkan jawabannya. Saya mungkin akan melakukannya dalam beberapa tahap.

— Glen_b -Reinstate Monica

@ Glen_b: Terima kasih, saya menantikannya. Saya juga ingin memperluas milik saya untuk menunjukkan bagaimana tes skor & tes rasio kemungkinan umum memberikan jawaban yang berbeda (secara umum); & teori tes yang tidak bias pasti layak disebutkan dalam konteks ini (tapi saya hampir tidak bisa mengingatnya).

— Scortchi