Tes yang membandingkan distribusi adalah tes yang tidak disertakan. Mereka mulai dengan hipotesis nol bahwa kedua populasi itu identik, kemudian mencoba menolak hipotesis itu. Kami tidak pernah dapat membuktikan bahwa nol itu benar, tolak saja, jadi tes ini tidak dapat benar-benar digunakan untuk menunjukkan bahwa 2 sampel berasal dari populasi yang sama (atau populasi yang identik).
Ini karena mungkin ada perbedaan kecil dalam distribusi (artinya mereka tidak identik), tetapi sangat kecil sehingga tes tidak dapat benar-benar menemukan perbedaan.
Pertimbangkan 2 distribusi, yang pertama adalah seragam dari 0 hingga 1, yang kedua adalah campuran dari 2 seragam, jadi itu adalah 1 antara 0 dan 0,999, dan juga 1 antara 9,999 dan 10 (0 di tempat lain). Jadi jelas distribusi ini berbeda (apakah perbedaannya bermakna adalah pertanyaan lain), tetapi jika Anda mengambil ukuran sampel 50 dari masing-masing (total 100) ada kemungkinan lebih dari 90% bahwa Anda hanya akan melihat nilai antara 0 dan 0,999 dan tidak dapat melihat perbedaan nyata.
Ada beberapa cara untuk melakukan apa yang disebut pengujian kesetaraan di mana Anda bertanya apakah 2 distribusi / populasi itu setara, tetapi Anda perlu mendefinisikan apa yang Anda anggap setara. Biasanya beberapa ukuran perbedaan berada dalam kisaran tertentu, yaitu perbedaan dalam 2 rata-rata kurang dari 5% dari rata-rata 2 rata-rata, atau statistik KS di bawah batas yang diberikan, dll. Jika Anda kemudian dapat menghitung interval kepercayaan untuk statistik perbedaan (perbedaan rata-rata bisa saja t interval kepercayaan, bootstrap, simulasi, atau metode lain mungkin diperlukan untuk statistik lainnya). Jika seluruh interval kepercayaan jatuh dalam "wilayah ekivalensi" maka kami menganggap 2 populasi / distribusi sebagai "setara".
Bagian yang sulit adalah mencari tahu apa wilayah kesetaraan seharusnya.