Hitung nilai-p dalam bootstrap berpasangan


8

Saya menemukan kertas baru dari kelompok Berkeley NLP tentang pengujian statistik, Investigasi Empiris Signifikansi Statistik di NLP .

Ada pseudocode untuk menghitung nilai-p dalam makalah, pada dasarnya, idenya adalah bahwa set sampel disampel dengan penggantian dari data . Kemudianx1,x2,...,xNx

p-value=count(δ(xi)>2δ(x))/N , di mana adalah gain metrik.δ(xi)

Saya bisa memahami rumus untuk menghitung nilai-p dalam makalah Koehn, uji signifikansi statistik untuk evaluasi terjemahan mesin , di mana:

p-value=count(δa(xi)<δb(xi))/N , di mana dan adalah gain metrik untuk sistem dan masing-masing.δaδbab

Apakah ada penjelasan atau referensi untuk formula . Para penulis juga mencatat bahwa jika rata-rata adalah dan simetris, maka kedua rumus di atas sama.p-value=count(δ(xi)>2δ(x))/Nδ(xsaya)δ(x)δ(xsaya)

Jawaban:


1

Sejauh yang saya mengerti dari melihat bagian 2, penulis tampaknya menjelaskan alasan mereka untuk tes bootstrap sebagai berikut-

"itu xsaya disampel dari x, dan rata-rata mereka δ(xi)tidak akan nol seperti tuntutan hipotesis nol; rata-rata sebaliknya akan adaδ(x)... Solusinya adalah memusatkan kembali mean - kami ingin tahu seberapa sering SEBUAH tidak lebih dari δ(x)lebih baik dari yang diharapkan. Kami berharap bisa mengalahkannyaB oleh δ(x). Karena itu, kami menghitung berapaxsaya memiliki SEBUAH mengalahkan B setidaknya δ(x). "

Penulis ingin menguji apakah keuntungannya bukan nol sehingga mereka menuliskan nilai-p sebagai δ(xsaya)<2δ(x) , yang dapat ditulis ulang sebagai 0<2δ(x)-δ(xsaya); karenaE[δ(xsaya)]=δ(x) RHS dari ketimpangan kemudian menjadi δ(x), yang merupakan H0 mereka berusaha menolak.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.