Misalkan saya memiliki sampel dari distribusi gabungan dari dan . Bagaimana saya menguji hipotesis bahwa dan adalah independen ?X Y X Y
Tidak ada asumsi yang dibuat pada undang-undang distribusi gabungan atau marginal dan (paling tidak dari semua normalitas gabungan, karena dalam hal itu independensi identik dengan korelasi menjadi ).Y 0
Tidak ada asumsi dibuat pada sifat hubungan yang mungkin antara dan ; mungkin non-linear, sehingga variabel tidak berkorelasi ( ) tetapi sangat co-dependen ( ).Y r = 0 I = H
Saya bisa melihat dua pendekatan:
Bin kedua variabel dan gunakan uji eksak Fisher atau G-test .
- Pro: gunakan tes statistik mapan
- Con: tergantung pada binning
Memperkirakan ketergantungan dari dan : (ini adalah untuk independen dan dan ketika mereka benar-benar menentukan satu sama lain).Y I ( X ; Y )XY1
- Pro: menghasilkan angka dengan makna teoretis yang jelas
- Con: tergantung pada perhitungan entropi perkiraan (yaitu, binning lagi)
Apakah pendekatan ini masuk akal?
Apa metode lain yang digunakan orang?