Mikro dan makro rata-rata (untuk metrik apa pun) akan menghitung hal-hal yang sedikit berbeda, dan dengan demikian interpretasinya berbeda. Rata-rata makro akan menghitung metrik secara independen untuk setiap kelas dan kemudian mengambil rata-rata (karenanya memperlakukan semua kelas secara merata), sedangkan rata-rata mikro akan mengumpulkan kontribusi semua kelas untuk menghitung metrik rata-rata. Dalam pengaturan klasifikasi multi-kelas, rata-rata mikro lebih disukai jika Anda menduga ada ketidakseimbangan kelas (yaitu Anda mungkin memiliki lebih banyak contoh satu kelas daripada kelas lainnya).
Untuk menggambarkan alasannya, ambil contoh presisi . Bayangkan Anda memiliki sistem klasifikasi multi-kelas One-vs-All (hanya ada satu output yang benar per contoh) dengan empat kelas dan angka-angka berikut ketika diuji:Pr = TP( TP+ FP)
- Kelas A: 1 TP dan 1 FP
- Kelas B: 10 TP dan 90 FP
- Kelas C: 1 TP dan 1 FP
- Kelas D: 1 TP dan 1 FP
Anda dapat melihat dengan mudah bahwa , sedangkan .PrSEBUAH= PrC= PrD= 0,5PrB= 0,1
- Rata-rata makro akan menghitung:Pr = 0,5 + 0,1 + 0,5 + 0,54= 0,4
- Mikro-rata-rata akan menghitung:Pr = 1 + 10 + 1 + 12 + 100 + 2 + 2= 0,123
Ini adalah nilai yang sangat berbeda untuk presisi. Secara intuitif, dalam rata-rata makro presisi "baik" (0,5) dari kelas A, C dan D berkontribusi untuk mempertahankan presisi keseluruhan "baik" (0,4). Meskipun ini benar secara teknis (lintas kelas, presisi rata-rata adalah 0,4), ini agak menyesatkan, karena sejumlah besar contoh tidak diklasifikasikan dengan benar. Contoh-contoh ini sebagian besar sesuai dengan kelas B, sehingga mereka hanya berkontribusi 1/4 terhadap rata-rata meskipun merupakan 94,3% dari data pengujian Anda. Rata-rata mikro akan secara memadai menangkap ketidakseimbangan kelas ini, dan membawa rata-rata presisi keseluruhan turun ke 0,123 (lebih sesuai dengan ketepatan kelas B yang mendominasi (0,1)).
Untuk alasan komputasi, kadang-kadang mungkin lebih nyaman untuk menghitung rata-rata kelas dan kemudian rata-rata makro. Jika ketidakseimbangan kelas diketahui sebagai masalah, ada beberapa cara untuk mengatasinya. Pertama adalah melaporkan tidak hanya rata-rata makro, tetapi juga standar deviasinya (untuk 3 kelas atau lebih). Lain adalah untuk menghitung rata-rata makro tertimbang, di mana setiap kontribusi kelas rata-rata tertimbang oleh jumlah relatif contoh yang tersedia untuk itu. Dalam skenario di atas, kami memperoleh:
Prm a c r o - m e a n= 0,25 ⋅ 0,5 + 0,25 ⋅ 0,1 + 0,25 ⋅ 0,5 + 0,25 ⋅ 0,5 = 0,4
Prm a c r o - s t de v= 0,173
Prm a c r o - w e i gh t e d= 0,0189 ⋅ 0,5 + 0,943 ⋅ 0,1 + 0,0189 ⋅ 0,5 + 0,0189 ⋅ 0,5= 0,009 + 0,094 + 0,009 + 0,009 = 0,123
Deviasi standar yang besar (0,173) telah memberi tahu kita bahwa rata-rata 0,4 tidak berasal dari ketepatan seragam di antara kelas-kelas, tetapi mungkin lebih mudah untuk menghitung rata-rata makro tertimbang, yang pada dasarnya adalah cara lain menghitung rata-rata mikro .