Secara umum, Informasi Nilai memberikan ukuran seberapa baik variabel mampu membedakan antara respon biner (misalnya "baik" versus "buruk") dalam beberapa variabel sasaran . Idenya adalah jika variabel memiliki Nilai Informasi yang rendah, itu mungkin tidak melakukan pekerjaan yang cukup untuk mengklasifikasikan variabel target, dan karenanya dihapus sebagai variabel penjelas.XYX
Untuk melihat bagaimana ini bekerja, biarkan dikelompokkan menjadi nampan. Setiap sesuai dengan yang mungkin mengambil salah satu dari dua nilai, katakan 0 atau 1. Kemudian untuk , ,Xnx ∈ Xy∈ YXsaya1 ≤ i ≤ n
sayaV=∑i = 1n(gsaya-bsaya) ∗ ln(gsaya/bsaya)
dimana
bsaya= ( # dari di dari di proporsi di bin versus semua nampan0Xsaya) / ( #0X) =0saya
gsaya= ( # of di of 's di proporsi di bin versus semua nampan1Xsaya) / ( #1X) =1saya
dalam(gsaya/bsaya) juga dikenal sebagai Bobot Bukti (untuk bin ). Nilai batas dapat bervariasi dan pemilihannya subjektif. Saya sering menggunakan (seperti halnya [1] di bawah).XsayasayaV< 0,3
Dalam konteks penilaian kredit, dua sumber ini akan membantu:
[1] http://www.mwsug.org/proceedings/2013/AA/MWSUG-2013-AA14.pdf
[2] http://support.sas.com/resources/papers/proceedings12/141-2012.pdf