Asumsikan, saya memiliki classifier (Ini bisa berupa pengklasifikasi standar seperti pohon keputusan, hutan acak, regresi logistik, dll.) Untuk deteksi penipuan menggunakan kode di bawah ini
library(randomForest)
rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier
Say, Y is a binary outcome - Fraud/Not-Fraud
Sekarang, saya telah memprediksi pada set data yang tidak terlihat .
pred = predict(rfFit, newData)
Kemudian saya mendapatkan umpan balik dari tim investigasi mengenai klasifikasi saya dan menemukan bahwa saya telah membuat kesalahan dengan mengklasifikasikan penipuan sebagai Non-Fraud (yaitu One False Negative ) . Apakah ada yang bisa saya biarkan algoritma saya mengerti bahwa ia telah melakukan kesalahan? mis. Apakah ada cara menambahkan umpan balik ke algoritma sehingga dapat memperbaiki kesalahan?
Salah satu opsi yang dapat saya pikirkan dari atas kepala saya adalah membangun sebuah adaboost classifier
sehingga classifier baru mengoreksi kesalahan yang lama. atau saya telah mendengar sesuatu dari Incremental Learning
atau Online learning
. Apakah ada implementasi (paket) yang ada di R
?
Apakah ini pendekatan yang tepat? atau Apakah ada cara lain untuk mengubah model alih-alih membangunnya dari awal?