Untuk setiap catatan dalam kumpulan data saya, saya memiliki informasi berikut
di mana adalah fitur, δ adalah 1 jika acara target terjadi dan 0 sebaliknya, dan T adalah cap waktu acara yang terjadi. Secara khusus, T mungkin akan hilang jika tidak ada acara atau waktu yang ditentukan untuk tindak lanjutnya.
Saya ingin menghitung indeks risiko untuk setiap catatan dalam dataset saya.
Saya berpikir untuk menggunakan model klasifikasi yang menggunakan fitur untuk memprediksi kelas δ . Namun, T penting: jika acara δ kemungkinan akan terjadi segera risikonya harus lebih tinggi.
Itu sebabnya analisis kelangsungan hidup harus sesuai untuk masalah ini. Saya tidak perlu estimasi penuh dari tetapi hanya satu indeks yang mewakili risiko untuk satu catatan.
Waktu survival rata-rata, yang dapat dihitung untuk setiap catatan, tampaknya indeks risiko yang bagus - semakin rendah semakin tinggi risikonya.
Pertanyaan saya adalah:
- Apakah analisis kelangsungan hidup cocok untuk tujuan saya?
- Bagaimana saya bisa mengevaluasi kinerja model saya?