Ok, ini usaha pertamaku. Tutup pengawasan dan komentar dihargai!
Hipotesa Dua Sampel
Jika kita dapat membingkai tes hipotesis Kolmogorov-Smirnov satu sisi dua sampel , dengan hipotesis nol dan alternatif di sepanjang baris berikut:
H 0 : F Y ( t ) ≥ F X ( t ) , dan0: FY(t)≥FX(t)
H A : F Y ( t ) < F X ( t ) , untuk setidaknya satu t , di mana:A: FY(t)<FX(t)t
statistik uji D - = | min t ( F Y ( t ) - F X ( t ) ) | D−=|mint(FY(t)−FX(t))| sesuai dengan H 0 : F Y ( t ) ≥ F X ( t ) ;0: FY(t)≥FX(t)
statistik uji D + = | maks. t ( F Y ( t ) - F X ( t ) ) | D+=|maxt(FY(t)−FX(t))|sesuai dengan H 0 : F Y ( t ) ≤ F X ( t ) ; dan0: FY(t)≤FX(t)
F Y ( t )FY(t) & F X ( t )FX(t) adalah CDF empirisdari sampel YY dan XX ,
maka harus masuk akal untuk membuat hipotesis interval umum untuk uji kesetaraan di sepanjang garis ini (dengan asumsi bahwa interval kesetaraan simetris untuk saat ini):
H - 0 : | F Y ( t ) - F X ( t ) | ≥ Δ , dan−0: |FY(t)−FX(t)|≥Δ
H - A : | F Y ( t ) - F X ( t ) | < Δ , setidaknya untuk satu t .−A: |FY(t)−FX(t)|<Δt
Ini akan menerjemahkan ke spesifik dua satu sisi "negativist" nol hipotesis untuk menguji untuk kesetaraan (dua hipotesis ini mengambil bentuk yang sama, karena kedua D + dan D - secara ketat non-negatif):D+D−
H - 01 : D + ≥ Δ , atau−01: D+≥Δ
H - 02 : D - ≥ Δ .−02: D−≥Δ
Menolak kedua H - 01 dan H - 02 akan membawa kita untuk menyimpulkan bahwa - Δ < F Y ( t ) - F X ( t ) < Δ . Tentu saja, interval ekivalensi tidak perlu simetris, dan - Δ dan Δ dapat diganti dengan Δ 2 (lebih rendah) dan Δ 1 (atas) untuk masing-masing hipotesis nol satu sisi.−01 −02−Δ<FY(t)−FX(t)<Δ−ΔΔΔ2Δ1
Statistik Uji (Diperbarui: Delta berada di luar tanda nilai absolut)
Statistik uji D + 1 dan D - 2 (meninggalkan n Y dan n X tersirat) masing-masing sesuai dengan H - 01 dan H - 02 , dan adalah:D+1D−2nYnX−01−02
D+1=Δ−D+=Δ−|maxt[(FY(t)−FX(t))]|D+1=Δ−D+=Δ−|maxt[(FY(t)−FX(t))]|, and
D−2=Δ−D−=Δ−|mint[(FY(t)−FX(t))]|D−2=Δ−D−=Δ−|mint[(FY(t)−FX(t))]|
The Equivalence / Relevance Threshold
Interval [ - Δ , Δ ] —atau [ Δ 2 , Δ 1 ] , jika menggunakan interval ekivalensi asimetris — dinyatakan dalam satuan D + dan D - , atau besarnya probabilitas yang dibedakan. Ketika n Y dan n X mendekati tak terhingga, CDF D + atau D - untuk n Y , n X mendekati 0 untuk t[−Δ,Δ][Δ2,Δ1]D+D−nYnXD+D−nY,nX0<0t<0, and for t≥0t≥0:
limnY,nX→∞p+=P(√nYnXnY+nXD+≤t)=1−e−2t2
limnY,nX→∞p+=P(nYnXnY+nX−−−−−−−−√D+≤t)=1−e−2t2
So it seems to me that the PDF for sample size-scaled D+D+ (or sample size-scaled D−D−) must be 00 for t<0t<0, and for t≥0t≥0:
f(t)=1−e−2t2ddt=4te−2t2
f(t)=1−e−2t2ddt=4te−2t2
Glen_b points out that this is a Rayleigh distribution with σ=12σ=12. So the large sample quantile function for sample size-scaled D+D+ and D−D− is:
CDF−1=Q(p)=√−ln(1−p)2
CDF−1=Q(p)=−ln(1−p)2−−−−−−−−−−√
and a liberal choice of ΔΔ might be the critical value Qα+σ/2=Qα+14Qα+σ/2=Qα+14, and a more strict choice the critical value Qα+σ/4=Qα+18Qα+σ/4=Qα+18.