Saya telah menulis sebuah program yang menghasilkan data acak. Jika program bekerja dengan benar, data tersebut harus mengikuti distribusi probabilitas khusus yang diketahui. Saya ingin menjalankan program, melakukan perhitungan pada hasilnya, dan menghasilkan nilai-p.
Sebelum orang lain mengatakannya: Saya mengerti bahwa pengujian hipotesis tidak dapat mendeteksi kapan program beroperasi dengan benar. Itu hanya dapat mendeteksi ketika beroperasi secara tidak benar dengan cara tertentu. (Dan bahkan kemudian, tes "harus" gagal X% dari waktu, tergantung pada tingkat signifikansi apa yang Anda pilih ...)
Jadi, saya mencoba untuk mendapatkan pemahaman tentang alat apa yang mungkin sesuai. Khususnya:
Saya dapat menghasilkan data acak sebanyak yang saya inginkan. Yang harus saya lakukan adalah membiarkan program berjalan cukup lama. Jadi saya tidak terbatas pada ukuran sampel tertentu.
Saya tertarik pada teknik yang menghasilkan nilai-p. Jadi menatap grafik dan berkata "ya, itu terlihat agak linier" bukanlah pilihan yang menarik. Kecuali ada beberapa cara untuk menempatkan angka keras pada "ketidakberuntungan" dari sebuah grafik. ;-)
Apa yang saya ketahui sejauh ini:
Saya telah melihat tiga jenis tes yang disebutkan yang sepertinya mungkin berlaku: uji chi-squared [Pearson], tes Kolmogorov-Smirnov dan tes Anderson-Darling.
Tampaknya tes chi-squared cocok untuk distribusi diskrit , sedangkan dua lainnya lebih sesuai untuk distribusi kontinu . (?)
Berbagai sumber mengisyaratkan bahwa tes AD "lebih baik" daripada tes KS, tetapi gagal masuk ke detail lebih lanjut.
Pada akhirnya, semua tes ini mungkin mendeteksi "berbagai cara" penyimpangan dari distribusi nol yang ditentukan. Tapi saya belum benar-benar tahu apa perbedaannya ... Singkatnya, saya sedang mencari semacam gambaran umum tentang di mana masing-masing jenis tes paling dapat diterapkan, dan masalah apa yang paling baik dideteksi.