Latar belakang: Ada beberapa pertanyaan / jawaban yang bagus di sini tentang cara mengkalibrasi model yang memprediksi probabilitas hasil yang terjadi. Sebagai contoh
- Skor Brier , dan penguraiannya menjadi resolusi, ketidakpastian dan keandalan .
- Plot kalibrasi dan regresi isotonik .
Metode-metode ini sering memerlukan penggunaan metode binning pada probabilitas yang diprediksi, sehingga perilaku hasil (0, 1) dihaluskan di atas nampan dengan mengambil hasil rata-rata.
Masalah: Namun, saya tidak dapat menemukan apa pun yang menginstruksikan saya tentang cara memilih lebar bin.
Pertanyaan: Bagaimana cara memilih lebar nampan optimal?
Mencoba: Dua lebar nampan yang biasa digunakan tampaknya adalah:
- Binning dengan lebar yang sama, misalnya 10 nampan yang masing-masing mencakup 10% dari interval [0, 1].
- Metode binning Tukey dibahas di sini .
Tetapi apakah pilihan-pilihan nampan ini paling optimal jika seseorang tertarik untuk menemukan interval dalam probabilitas yang diprediksi yang paling salah perhitungan?