Saat ini saya bekerja dengan sejumlah besar data klaim asuransi kesehatan yang mencakup beberapa klaim laboratorium dan farmasi. Namun, informasi paling konsisten dalam kumpulan data terdiri dari diagnosis (ICD-9CM) dan kode prosedur (CPT, HCSPCS, ICD-9CM).
Tujuan saya adalah:
- Identifikasi kondisi prekursor yang paling berpengaruh (komorbiditas) untuk kondisi medis seperti penyakit ginjal kronis;
- Identifikasi kemungkinan (atau kemungkinan) bahwa seorang pasien akan mengembangkan kondisi medis berdasarkan kondisi yang mereka miliki di masa lalu;
- Lakukan hal yang sama seperti 1 dan 2, tetapi dengan prosedur dan / atau diagnosa.
- Lebih disukai, hasilnya akan ditafsirkan oleh dokter
Saya telah melihat hal-hal seperti kertas Warisan Hadiah Kesehatan Heritage dan telah belajar banyak dari mereka, tetapi mereka berfokus pada memprediksi rawat inap.
Jadi inilah pertanyaan saya: Metode apa yang menurut Anda cocok untuk masalah seperti ini? Dan, sumber daya apa yang paling berguna untuk belajar tentang aplikasi sains data dan metode yang relevan dengan perawatan kesehatan dan kedokteran klinis?
EDIT # 2 untuk menambahkan tabel plaintext:
CKD adalah kondisi target, "penyakit ginjal kronis", ".Setiap" menunjukkan bahwa mereka telah memperoleh kondisi itu setiap saat, ".isbefore.ckd" berarti mereka memiliki kondisi itu sebelum diagnosis CKD pertama mereka. Singkatan lainnya sesuai dengan kondisi lain yang diidentifikasi oleh pengelompokan kode ICD-9CM. Pengelompokan ini terjadi dalam SQL selama proses impor. Setiap variabel, dengan pengecualian patient_age, adalah biner.