Ya, Anda bisa mengenakan model regresi logistik. Tapi pertama-tama, saya ingin membahas poin tentang AUC (Area Di Bawah Kurva Karakteristik Operasi Penerima): Tidak ada aturan praktis praktis dengan AUC, yang pernah ada.
Apa itu AUC adalah probabilitas bahwa sampel positif acak (atau kasus) akan memiliki nilai penanda lebih tinggi daripada negatif (atau kontrol) karena AUC secara matematis setara dengan statistik U.
Apa yang tidak AUC adalah ukuran standar dari akurasi prediksi. Peristiwa yang sangat deterministik dapat memiliki AUC prediktor tunggal 95% atau lebih tinggi (seperti dalam mekatronika terkontrol, robotika, atau optik), beberapa model prediksi risiko logistik multivariabel yang kompleks memiliki AUC 64% atau lebih rendah seperti prediksi risiko kanker payudara, dan tingkat akurasi prediksi yang tinggi.
Nilai AUC yang masuk akal, seperti halnya dengan analisis kekuatan, ditentukan sebelumnya dengan mengumpulkan pengetahuan tentang latar belakang dan tujuan penelitian apriori . Dokter / insinyur menjelaskan apa yang mereka inginkan, dan Anda, ahli statistik, menentukan nilai AUC target untuk model prediksi Anda. Kemudian mulailah penyelidikan.
Memang mungkin untuk mengenakan model regresi logistik. Selain dari ketergantungan linier (jika matriks model memiliki peringkat kekurangan), Anda juga dapat memiliki konkordansi sempurna, atau itu adalah plot nilai yang dipasang terhadap Y yang membedakan kasus dan kontrol dengan sempurna. Dalam hal ini, parameter Anda belum konvergen tetapi hanya berada di suatu tempat di ruang batas yang memberikan kemungkinan . Namun, kadang-kadang, AUC adalah 1 secara kebetulan saja.∞
Ada jenis bias lain yang muncul dari menambahkan terlalu banyak prediktor ke model, dan itu bias sampel kecil. Secara umum, rasio odds log dari model regresi logistik cenderung ke arah faktor bias karena non-collapability dari rasio odds dan jumlah sel nol. Dalam kesimpulan, ini ditangani menggunakan regresi logistik bersyarat untuk mengontrol variabel pengganggu dan presisi dalam analisis bertingkat. Namun, dalam prediksi, Anda adalah SOOL. Tidak ada prediksi yang dapat digeneralisasikan ketika Anda memiliki , ( ) karena Anda dijamin telah memodelkan "data" dan tidak "tren" pada saat itu. Dimensi tinggi ( besarp ≫ n π ( 1 - π ) π = Prob ( Y = 1 )2 βp ≫ n π( 1 - π)π= Prob ( Y= 1 )hal) prediksi hasil biner lebih baik dilakukan dengan metode pembelajaran mesin. Memahami analisis diskriminan linier, kuadrat terkecil parsial, prediksi tetangga terdekat, peningkatan, dan hutan acak akan menjadi tempat yang sangat baik untuk memulai.