Masalahnya mengacu pada pembuatan pohon keputusan. Menurut Wikipedia ' koefisien Gini ' tidak boleh disamakan dengan ' pengotor Gini '. Namun kedua ukuran tersebut dapat digunakan saat membangun pohon keputusan - ini dapat mendukung pilihan kita saat membagi set item.
1) 'Pengotor Gini' - ini adalah metrik pemisah pohon keputusan standar (lihat tautan di atas);
2) 'Koefisien Gini' - setiap pemisahan dapat dinilai berdasarkan kriteria AUC. Untuk setiap skenario pemisahan, kita dapat membuat kurva ROC dan menghitung metrik AUC. Menurut Wikipedia AUC = (GiniCoeff + 1) / 2;
Pertanyaannya adalah: apakah kedua tindakan ini setara? Di satu sisi, saya diberitahu bahwa koefisien Gini tidak boleh dikacaukan dengan ketidakmurnian Gini. Di sisi lain, kedua langkah ini dapat digunakan dalam melakukan hal yang sama - menilai kualitas pohon keputusan.