Ketika Anda mengklasifikasikan menggunakan logit, inilah yang terjadi.
Logit memprediksi probabilitas default (PD) dari pinjaman, yang merupakan angka antara 0 dan 1. Selanjutnya, Anda menetapkan ambang D, sehingga Anda menandai pinjaman ke default jika PD> D, dan menandainya sebagai non- default jika PD
Secara alami, dalam populasi pinjaman khas PD << 1. Jadi, dalam kasus Anda 7% adalah probabilitas yang cukup tinggi untuk data satu tahun (PD biasanya dilaporkan setiap tahun). Jika ini adalah data multi-tahun, maka kita berbicara tentang apa yang disebut PD kumulatif, dalam hal ini cumPD = 7% bukan angka yang tinggi untuk data 10 tahun, misalnya. Oleh karena itu, berdasarkan standar apa pun, saya tidak akan mengatakan bahwa kumpulan data Anda bermasalah. Saya akan menggambarkannya setidaknya khas untuk data standar pinjaman, jika tidak besar (dalam arti bahwa Anda memiliki sejumlah besar standar relatif).
Sekarang, anggaplah model Anda memprediksi tiga level PD berikut:
- 0,1 (563.426)
- 0,5 (20.000)
- 0,9 (31,932)
Misalkan juga default aktual untuk grup ini adalah:
Sekarang Anda dapat mengatur D ke nilai yang berbeda dan melihat bagaimana perubahan matriks. Mari kita gunakan D = 0,4 pertama:
- Default aktual, prediksi non-default: 0
- Default aktual, prediksi default: 41.932
- Non-standar aktual, prediksi non-standar: 563.426
- Non-default aktual, prediksi default: 10.000
Jika Anda menetapkan D = 0,6:
- Default aktual, prediksi non-default: 31.932
- Default aktual, prediksi default: 10.000
- Non-default aktual, prediksi non-default: 573.426
- Non-default aktual, prediksi default: 0
Jika Anda menetapkan D = 0,99:
- Default aktual, prediksi non-default: 41.932
- Default aktual, prediksi default: 0
- Non-default aktual, prediksi non-default: 573.426
- Non-default aktual, prediksi default: 0
Kasus terakhir adalah apa yang Anda lihat dalam hasil model Anda. Dalam hal ini saya menekankan ambang D untuk classifier. Perubahan sederhana dalam D dapat meningkatkan karakteristik tertentu dari perkiraan Anda. Perhatikan, bahwa dalam ketiga kasus, PD yang diprediksi tetap sama, hanya ambang D yang berubah.
Mungkin juga bahwa regresi logit Anda jelek, tentu saja. Jadi, dalam hal ini Anda memiliki setidaknya dua variabel: spec logit dan ambang batas. Keduanya memengaruhi kekuatan perkiraan Anda.