Mari kita perhatikan dua variabel ( , ). Ketika Anda mengatakan bin data, dan Anda "bin" pada , maksud Anda mengulangi pengukuran untuk sama untuk mendapatkan nilai sesuai ? Jika Anda mengulangi pengukuran seperti ini, maka kesalahan rata-rata akan berkurang dengan , dan saya pikir Anda bebas melakukan apa pun yang Anda inginkan dengannya. Pastikan Anda menggunakan koefisien korelasi tertimbang jika Anda mempertimbangkan titik data dengan bilah galat yang sangat berbeda.XiYiXiXiY′in−−√
Sekarang katakanlah Anda tidak mengulangi pengukuran , tetapi sebaliknya mempertimbangkan dan yang sesuai dan -binning pada dan mendapatkan nilai yang disimpan di dalam . Saya pikir dalam situasi ini solusinya akan tergantung pada hubungan antara ukuran tempat sampah, kesalahan pada pengukuran, dan kemiringan korelasi. Saya berharap bahwa jika dan kecil, situasinya akan sama dengan paragraf sebelumnya. Kalau tidak, mungkin menguntungkan untuk bin atau tidak; itu akan mengubah hasil karena cov ( ,XiXi±δYi±δ′δδδδ´Xi,binYi,bin) akan berbeda dari nilai - nilai yang tidak dicentang, tapi saya pikir itu masih berlaku untuk melakukannya. Saya pikir Anda tidak melanggar asumsi apa pun; Saya hanya akan memastikan itu menguntungkan untuk melakukannya, dan saya akan menguji signifikansinya melalui uji permutasi (untuk menghindari membuat asumsi pada distribusi koefisien).