Penjelasan pada halaman referensi adalah
Di bawah hipotesis nol probabilitas persis ketika kedua keacakan dalam data dan keacakan dalam simulasi diperhitungkan.k / n simPr(P≤k/nsim)k/nsim
Untuk memahami hal ini, kita harus melihat kode yang garis kuncinya (disingkat jauh)
fred <- function(x) {ks.test(...)$statistic} # Apply a statistical test to an array
d.hat <- fred(x) # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
2, fred) # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value
Masalah yang menonjol adalah bahwa kode tidak cocok dengan kutipan. Bagaimana kita bisa mendamaikan mereka? Satu upaya dimulai dengan bagian terakhir dari kutipan. Kami mungkin menginterpretasikan prosedur sebagai terdiri dari langkah-langkah berikut:
Kumpulkan independen dan identik didistribusikan Data menurut beberapa hukum probabilitas . Terapkan prosedur uji (diimplementasikan dalam kode sebagai ) untuk menghasilkan angka . G t T 0 = t ( X 1 , ... , X n )X1,X2,…,XnGtfred
T0=t(X1,…,Xn)
Menghasilkan melalui komputer dataset yang sebanding, masing-masing ukuran , menurut sebuah hipotesis nol dengan hukum probabilitas . Terapkan ke setiap dataset tersebut untuk menghasilkan angka . n F t N T 1 , T 2 , … , T NN=nsimnFtNT1,T2,…,TN
Hitung
P=(∑i=1NI(Ti>T0)+1)/(N+1).
(" " adalah fungsi indikator yang diimplementasikan oleh perbandingan bernilai vektor dalam kode.) Sisi kanan dipahami acak berdasarkan keacakan simultan (statistik uji aktual) dan keacakan ( statistik uji simulasi). T 0 T iId.star > d.hat
T0Ti
Untuk mengatakan bahwa data sesuai dengan hipotesis nol adalah untuk menegaskan bahwa . Pilih ukuran uji , . Mengalikan kedua sisi dengan dan mengurangi menunjukkan bahwa peluang bahwa untuk angka apa pun adalah peluang yang tidak lebih dari dari melebihi . Ini hanya mengatakan bahwa terletak di bagian atas dari set statistik semua tes yang diurutkan . Sejak (dengan konstruksi)F=Gα0<α<1N+11P≤αα(N+1)α−1TiT0T0(N+1)αN+1T0tidak tergantung pada semua , ketika adalah distribusi kontinu, kesempatan ini akan menjadi fraksi dari total yang diwakili oleh bagian integer ; yaitu, dan itu akan persis sama dengan yang disediakan adalah bilangan ; yaitu ketika .TiF⌊(N+1)α⌋(N+1)αkα=k/(N+1)
Pr(P≤α)=⌊(N+1)α⌋N+1≈α
(N+1)αkα=k/(N+1)
Ini tentu saja adalah salah satu hal yang ingin kita benar dari kuantitas apa pun yang pantas disebut "nilai-p": itu harus memiliki distribusi yang seragam pada . Asalkan cukup besar, sehingga setiap dekat dengan sebagian kecil dari bentuk , ini akan memiliki dekat dengan seragam distribusi. (Untuk mempelajari tentang kondisi tambahan yang diperlukan dari nilai-p, silakan baca dialog yang saya pasang pada subjek nilai-p. )N + 1 α k / ( N + 1 ) = k / ( n sim + 1 ) P[0,1]N+1αk/(N+1)=k/(nsim+1)P
Jelas kutipan harus menggunakan " " bukannya " " di mana pun itu muncul.n simnsim+1nsim