Seperti halnya metrik apa pun, metrik yang baik adalah yang lebih baik daripada yang "bodoh", tebak secara kebetulan, jika Anda harus menebak tanpa informasi tentang pengamatan. Ini disebut model intersep-only dalam statistik.
Tebak "bodoh" ini tergantung pada 2 faktor:
- jumlah kelas
- keseimbangan kelas: prevalensi mereka dalam dataset yang diamati
Dalam kasus metrik LogLoss, satu metrik biasa "terkenal" adalah mengatakan bahwa 0,693 adalah nilai non-informatif. Angka ini diperoleh dengan memprediksi p = 0.5
untuk setiap kelas masalah biner. Ini hanya berlaku untuk masalah biner seimbang . Karena ketika prevalensi satu kelas adalah 10%, maka Anda akan selalu memprediksi p =0.1
untuk kelas itu. Ini akan menjadi dasar Anda prediksi bodoh, kebetulan, karena memprediksi 0.5
akan menjadi bodoh.
I. Dampak dari jumlah kelas N
pada dumb-logloss:
Dalam kasus seimbang (setiap kelas memiliki prevalensi yang sama), ketika Anda memprediksi p = prevalence = 1 / N
untuk setiap pengamatan, persamaannya menjadi sederhana:
Logloss = -log(1 / N)
log
sedang Ln
, logaritma neperian untuk mereka yang menggunakan konvensi itu.
Dalam kasus biner, N = 2
:Logloss = - log(1/2) = 0.693
Jadi Logosses bodoh adalah sebagai berikut:
II Dampak dari prevalensi kelas pada dumb-Logloss:
Sebuah. Kasus klasifikasi biner
Dalam hal ini, kami selalu memprediksi p(i) = prevalence(i)
, dan kami mendapatkan tabel berikut:
Jadi, ketika kelas sangat tidak seimbang (prevalensi <2%), logloss 0,1 sebenarnya bisa sangat buruk! Seperti akurasi 98% akan buruk dalam kasus itu. Jadi mungkin Logloss tidak akan menjadi metrik terbaik untuk digunakan
b. Kasing tiga kelas
"Bodoh" -logloss tergantung pada prevalensi - kasus tiga kelas:
Kita bisa melihat di sini nilai-nilai kasus biner seimbang dan tiga kelas (0,69 dan 1,1).
KESIMPULAN
Logloss 0,69 mungkin baik dalam masalah multikelas, dan sangat buruk dalam kasus bias biner.
Bergantung pada kasus Anda, Anda sebaiknya menghitung sendiri garis dasar masalah, untuk memeriksa arti prediksi Anda.
Dalam kasus bias, saya mengerti bahwa logloss memiliki masalah yang sama dengan keakuratan dan fungsi kerugian lainnya: ia hanya menyediakan pengukuran kinerja global Anda. Jadi, Anda sebaiknya melengkapi pemahaman Anda dengan metrik yang berfokus pada kelas-kelas minoritas (mengingat dan presisi), atau mungkin tidak menggunakan logloss sama sekali.