Saya tahu bahwa model statistik tradisional seperti regresi Cox Proportional Hazards & beberapa model Kaplan-Meier dapat digunakan untuk memprediksi hari sampai kejadian berikutnya dari suatu peristiwa katakanlah kegagalan dll. Yaitu analisis survival
Pertanyaan
- Bagaimana versi regresi model pembelajaran mesin seperti GBM, jaringan saraf dll dapat digunakan untuk memprediksi hari sampai terjadinya suatu peristiwa?
- Saya percaya hanya menggunakan hari sampai kejadian sebagai variabel target dan menyederhanakan menjalankan model regresi tidak akan berhasil? Mengapa itu tidak bekerja & bagaimana bisa diperbaiki?
- Bisakah kita mengubah masalah analisis survival menjadi klasifikasi dan kemudian memperoleh probabilitas survival? Jika demikian bagaimana cara membuat variabel target biner?
- Apa pro & kontra dari pendekatan pembelajaran mesin vs regresi Cox Proportional Hazards & model Kaplan-Meier dll?
Bayangkan sampel data input dalam format di bawah ini
catatan:
- Sensor ping data pada interval 10 menit tetapi kadang-kadang data dapat hilang karena masalah jaringan dll sebagaimana diwakili oleh baris dengan NA.
- var1, var2, var3 adalah prediktor, variabel penjelas.
- failure_flag memberi tahu apakah mesin gagal atau tidak.
- Kami memiliki data 6 bulan terakhir pada setiap interval 10 menit untuk setiap id mesin
EDIT:
Prediksi output yang diharapkan harus dalam format di bawah ini
Catatan: Saya ingin memprediksi kemungkinan kegagalan untuk masing-masing mesin selama 30 hari ke depan pada tingkat harian.
failure_flag
.