Mengapa tes Kolmogorov-Smirnov bekerja?

Dalam membaca tentang uji KS 2-sampel, saya mengerti persis apa yang dilakukannya tetapi saya tidak mengerti mengapa itu bekerja .

Dengan kata lain, saya dapat mengikuti semua langkah untuk menghitung fungsi distribusi empiris, menemukan perbedaan maksimum antara keduanya untuk menemukan D-statistik, menghitung nilai kritis, mengubah D-statistik ke nilai p dll.

Tapi, saya tidak tahu mengapa semua ini benar-benar memberi tahu saya apa-apa tentang dua distribusi.

Seseorang dapat dengan mudah mengatakan kepada saya bahwa saya perlu melompati seekor keledai dan menghitung seberapa cepat ia lari dan jika kecepatannya kurang dari 2 km / jam maka saya menolak hipotesis nol. Tentu saya bisa melakukan apa yang Anda perintahkan, tetapi apa hubungannya dengan hipotesis nol?

Mengapa uji KS 2 sampel berfungsi? Apa penghitungan perbedaan maksimum antara ECDFs harus dilakukan dengan betapa berbedanya kedua distribusi itu?

Bantuan apa pun dihargai. Saya bukan ahli statistik, jadi anggaplah saya bodoh jika memungkinkan.

— Darcy
sumber

Selamat datang di CV, Darcy! Pertanyaan bagus!

— Alexis

Melompati seekor keledai ... :)

— Richard Hardy

Jawaban:

Pada dasarnya, tes ini konsisten sebagai hasil langsung dari teorema Glivenko Cantelli, salah satu hasil paling penting dari proses empiris dan mungkin statistik.

GC memberi tahu kita bahwa statistik uji Kolmogorov Smirnov menjadi 0 sebagai bawah hipotesis nol. Ini mungkin tampak intuitif sampai Anda bergulat dengan analisis nyata dan membatasi teorema. Ini adalah wahyu karena proses tersebut dapat dianggap sebagai proses acak yang tak terhingga banyaknya, sehingga hukum atau probabilitas akan membuat orang percaya bahwa selalu ada satu titik yang bisa melampaui batas epsilon apa pun tetapi tidak, supremum akan menyatu dalam jangka panjang. $n \rightarrow \infty$

Berapa lama? Mmyyeeaa saya tidak tahu. Kekuatan tes ini agak meragukan. Saya tidak pernah menggunakannya dalam kenyataan.

http://www.math.utah.edu/~davar/ps-pdf-files/Kolmogorov-Smirnov.pdf

— AdamO
sumber

+1 Hai AdamO! Dapatkan satu atau dua kalimat mengambil kekuatan menjadi "agak meragukan?" Saya akan senang perspektif itu (saya telah mengumpulkan bahwa tes ini dianggap mudah "dikalahkan").

— Alexis

@Alexis Tes tidak dikalahkan, IRL kita hampir tidak pernah berharap nol menjadi benar, melainkan kita tidak peduli apakah persentil 99,999 berbeda 0,1 antara dan ., Jadi setiap kali saya melihat dari Tes KS, yang saya pikirkan adalah, "itu negatif palsu" dan setiap kali saya melihat saya pikir "whoop-dee-do jadi apa yang bisa Anda katakan tentang itu ?". Tes hipotesis nol yang kuat bukan cara yang menarik untuk menyajikan bukti ilmiah.

F_{1}

$F_1$

F_{2}

$F_2$

p > 0.05

$p > 0.05$

p < 0.05

$p < 0.05$

F_{1} = F_{2}

$F_1 = F_2$

— AdamO

Baik. Saya mendapatkan perhatian Anda dengan tes hipotesis untuk perbedaan. Tetapi apakah kekhawatiran Anda tentang kekuasaan muncul dari keyakinan ontologis sederhana bahwa hampir pasti ? atau adakah sesuatu yang lebih matematis tentang asimptotik atau sesuatu yang lain di sana?

F_{1}

$F_{1}$

\neq F_{2}

$\ne F_{2}$

— Alexis

@Alexis tidak, saya tidak punya masalah dengan matematika ujian. Bahkan, saya pikir itu cukup elegan dan hasil teorema batas sangat mengesankan.

— AdamO

@Alexis Saya akan mengatakan, dalam pengaturan di mana ia adalah mungkin bagi untuk menjadi persis sama dengan , tes bisa sangat berguna. Saya setuju bahwa tidak banyak aplikasi ilmiah substantif yang sesuai dengan RUU itu, tetapi dalam konteks komputasi statistik di mana Anda ingin memvalidasi bahwa beberapa perangkat lunak yang Anda tulis menghasilkan angka acak semu dari distribusi yang diketahui, itu cukup berguna. Ini secara efektif mengodifikasi intuisi yang Anda dapatkan dari melihat plot peluang.

F_{1}

$F_1$

F_{2}

$F_2$

— jcz

Kami memiliki dua sampel independen dan univariat:

\begin{aligned} X_{1}, X_{2}, . . ., X_{N} & \overset{i i d}{\sim} F \\ Y_{1}, Y_{2}, . . ., Y_{M} & \overset{i i d}{\sim} G, \end{aligned}

$\begin{align} X_1,\,X_2,\,...,\,X_N&\overset{iid}{\sim}F\\ Y_1,\,Y_2,\,...,\,Y_M&\overset{iid}{\sim}G, \end{align}$ mana dan adalah fungsi distribusi kumulatif kontinu. Tes Kolmogorov-Smirnov menguji Jika hipotesis nol adalah benar, maka dan adalah sampel dari distribusi yang sama. Yang diperlukan untuk dan untuk menjadi undian dari distribusi yang berbeda adalah untuk dan

G

$G$

F

$F$

\begin{aligned} H_{0} & : F (x) = G (x) for all x \in R \\ H_{1} & : F (x) \neq G (x) for some x \in R . \end{aligned}

$\begin{align} H_0&:F(x) = G(x)\quad\text{for all } x\in\mathbb{R}\\ H_1&:F(x) \neq G(x)\quad\text{for some } x\in\mathbb{R}. \end{align}$

{X_{i}}_{i = 1}^{N}

$\{X_i\}_{i=1}^N$

{Y_{j}}_{j = 1}^{M}

$\{Y_j\}_{j=1}^M$

X_{i}

$X_i$

Y_{j}

$Y_j$

F

$F$

G

$G$ berbeda dengan jumlah berapa pun setidaknya satu nilai . Jadi tes KS memperkirakan dan dengan CDF empiris dari masing-masing sampel, mengasah perbedaan selisih terbesar antara keduanya, dan menanyakan apakah perbedaan itu "cukup besar" untuk menyimpulkan bahwa di beberapa .

x

$x$

F

$F$

G

$G$

F (x) \neq G (x)

$F(x)\neq G(x)$

x \in R

$x\in\mathbb{R}$

— jcz
sumber

Pengambilan yang intuitif:

Tes Kolmogorov-Smirnov sangat bergantung pada urutan pengamatan berdasarkan distribusi. Logikanya adalah jika kedua distribusi yang mendasarinya sama, maka — tergantung pada ukuran sampel — pemesanan harus dikocok dengan baik di antara keduanya.

Jika pemesanan sampel "tidak diacak" dengan cara yang cukup ekstrim (misalnya, semua atau sebagian besar pengamatan dalam distribusi datang sebelum pengamatan dalam distribusi , yang akan membuat statistik jauh lebih besar), yang diambil sebagai bukti bahwa nol hipotesis bahwa distribusi yang mendasarinya tidak identik. $Y$ $X$ $D$

Jika dua distribusi sampel dikocok dengan baik, maka tidak akan memiliki kesempatan untuk menjadi sangat besar karena nilai yang diurutkan dari dan akan cenderung untuk mengikuti satu sama lain, dan Anda tidak akan memiliki cukup bukti untuk menolak nol . $D$ $X$ $Y$

— Alexis
sumber