Saya mengalami beberapa kesulitan dalam memahami interpretasi dari 2 sampel tes KS, dan bagaimana perbedaannya dari uji t reguler antara 2 kelompok.
Katakanlah saya memiliki pria dan wanita melakukan beberapa tugas dan saya mengumpulkan beberapa skor dari tugas itu. Tujuan utama saya adalah menentukan apakah pria dan wanita memiliki performa yang berbeda dalam tugas itu
Jadi satu hal yang bisa saya lakukan adalah menjalankan tes antara 2 kelompok. Hal lain yang bisa saya lakukan adalah menghitung ECDF untuk pria dan wanita, plot mereka, dan melakukan tes KS 2 sampel. Saya akan mendapatkan sesuatu seperti ini:
Tes KS
Hipotesis nol untuk uji KS adalah bahwa 2 set distribusi skor kontinu berasal dari populasi yang sama
Saat melakukan tes KS, saya mendapatkan: D = 0,18888, p-value = 0,04742
Pertama, saya ingin memeriksa apakah interpretasi saya terhadap hasilnya benar. Di sini, saya akan menolak hipotesis nol dan mengatakan bahwa distribusi skor pria dan wanita berasal dari populasi yang berbeda. Atau dengan kata lain, distribusi skor pria dan wanita berbeda satu sama lain.
Lebih khusus, laki-laki cenderung memiliki probabilitas lebih tinggi untuk mencapai skor yang lebih rendah pada tugas ini, dan itu adalah perbedaan antara 2 jenis kelamin seperti yang saya tafsirkan dari plot.
Uji-T
Sekarang pada tes akan menguji perbedaan antara rata-rata pria dan wanita pada variabel skor.
Mari kita bayangkan kasus di mana kinerja pria lebih buruk daripada wanita dalam tugas ini. Dalam hal itu, distribusi skor laki-laki akan berpusat di sekitar rata-rata rendah, sedangkan distribusi skor perempuan akan berpusat di sekitar rata-rata tinggi. Skenario ini akan sejalan dengan plot di atas, karena laki-laki akan memiliki kemungkinan lebih tinggi untuk mencapai skor yang lebih rendah
Jika uji t ternyata signifikan, saya akan menyimpulkan bahwa skor perempuan, rata-rata, secara signifikan lebih tinggi daripada laki-laki. Atau dalam hal populasi, skor wanita diambil dari populasi yang rata-rata lebih tinggi daripada populasi pria, yang terdengar sangat mirip dengan kesimpulan KS bahwa mereka berasal dari populasi yang berbeda.
Apa bedanya?
Jadi kesimpulan yang akan saya ambil dalam kasus KS dan uji t adalah sama. Laki-laki berkinerja buruk dibandingkan dengan perempuan. Jadi apa manfaat menggunakan satu tes di atas yang lain? Apakah ada pengetahuan baru yang bisa Anda peroleh dari menggunakan tes KS?
Cara saya melihatnya, laki-laki dengan distribusi berpusat di sekitar rata-rata rendah, dan perempuan berpusat di sekitar rata-rata tinggi adalah apa yang menyebabkan uji t signifikan. Tetapi dengan fakta yang sama itu , laki-laki akan memiliki probabilitas yang lebih tinggi untuk mencetak nilai yang lebih rendah, yang akan menyebabkan plot terlihat seperti di atas dan memberikan uji KS yang signifikan. Jadi hasil dari kedua tes memiliki penyebab dasar yang sama, tetapi mungkin orang dapat berargumen bahwa uji KS memperhitungkan lebih dari sekedar sarana distribusi dan juga mempertimbangkan bentuk distribusi, tetapi apakah mungkin untuk menguraikan penyebabnya dari uji KS signifikan dari hanya hasil tes?
Jadi berapakah nilai menjalankan tes KS saat ujian? Dan mari kita asumsikan bahwa saya dapat memenuhi asumsi uji t untuk pertanyaan ini