Pemisahan sampel mungkin dapat mengurangi masalah dengan distribusi statistik, tetapi tidak menghapusnya.
Gagasan Anda menghindari masalah bahwa perkiraan akan 'terlalu dekat' relatif terhadap nilai populasi karena didasarkan pada sampel yang sama.
Anda tidak menghindari masalah yang masih diperkirakan. Distribusi statistik uji bukan yang ditabulasi.
Dalam hal ini meningkatkan tingkat penolakan di bawah nol, bukannya mengurangi secara dramatis.
Pilihan yang lebih baik adalah menggunakan tes di mana parameter tidak dianggap diketahui, seperti Shapiro Wilk.
Jika Anda menggunakan jenis tes Kolmogorov-Smirnov, Anda dapat mengambil pendekatan tes Lilliefors.
Artinya, untuk menggunakan statistik KS tetapi memiliki distribusi statistik uji mencerminkan efek estimasi parameter - mensimulasikan distribusi statistik uji di bawah estimasi parameter. (Tidak lagi bebas distribusi, jadi Anda perlu tabel baru untuk setiap distribusi.)
http://en.wikipedia.org/wiki/Lilliefors_test
Liliefors menggunakan simulasi untuk kasus normal dan eksponensial, tetapi Anda dapat dengan mudah melakukannya untuk distribusi tertentu; dalam sesuatu seperti R itu masalah saat untuk mensimulasikan 10.000 atau 100.000 sampel dan mendapatkan distribusi statistik uji di bawah nol.
[Alternatif mungkin untuk mempertimbangkan Anderson-Darling, yang memang memiliki masalah yang sama, tetapi yang - menilai dari buku karya D'Agostino dan Stephens ( Goodness-of-fit-teknik ) tampaknya kurang sensitif terhadapnya. Anda bisa mengadaptasi ide Lilliefors, tetapi mereka menyarankan penyesuaian yang relatif sederhana yang tampaknya bekerja dengan cukup baik.]
Namun masih ada pendekatan lain; ada keluarga uji kelancaran goodness of fit, misalnya (misalnya, lihat buku karya Rayner dan Best) yang dalam sejumlah kasus tertentu dapat menangani estimasi parameter.
* efeknya masih bisa cukup besar - mungkin lebih besar dari biasanya dianggap dapat diterima; Momo benar untuk mengungkapkan kekhawatirannya. Jika tingkat kesalahan tipe I yang lebih tinggi (dan kurva daya yang lebih rata) adalah masalah, maka ini mungkin bukan peningkatan!