Karena pertanyaannya masih belum dijawab, inilah 2ct saya:
Saya pikir di sini ada dua topik berbeda yang tercampur dalam pertanyaan ini:
Bagaimana saya bisa menghitung sensitivitas dan spesifisitas (atau tindakan analog) dari tes diagnostik berkelanjutan dalam memprediksi hasil yang berkelanjutan (misalnya, tekanan darah) tanpa mendikotomisasi hasilnya?
Saya menganggap Anda ingin mengukur kinerja model. Model memprediksi hasil kontinu (metrik) dari beberapa jenis input (kebetulan juga metrik dalam contoh Anda, tetapi itu tidak terlalu penting di sini). Ini adalah skenario regresi, bukan klasifikasi. Jadi Anda lebih baik mencari ukuran kinerja untuk model regresi, sensitivitas dan spesifisitas bukan apa yang Anda cari *.
Beberapa masalah regresi memiliki "alami" pengelompokan menjadi ada dan tidak adanya sesuatu, yang memberikan tautan ke klasifikasi. Untuk itu Anda mungkin memiliki distribusi bimodal: banyak kasus tanpa kehadiran, dan distribusi nilai metrik untuk kasus kehadiran. Misalnya, pikirkan zat yang mencemari suatu produk. Banyak sampel produk tidak akan mengandung kontaminan, tetapi bagi mereka yang melakukannya, berbagai konsentrasi diamati.
Namun, ini bukan kasus untuk contoh tekanan darah Anda (tidak adanya tekanan darah bukanlah konsep yang masuk akal di sini). Saya bahkan akan menebak bahwa tekanan darah datang dalam distribusi unimodal. Semua itu menunjuk ke masalah regresi tanpa kaitan erat dengan klasifikasi.
* Dengan peringatan bahwa kedua kata tersebut digunakan dalam kimia analitik untuk regresi (kalibrasi), tetapi dengan makna yang berbeda: di sana, sensitivitas adalah kemiringan fungsi kalibrasi / regresi, dan spesifik kadang-kadang berarti bahwa metode ini sepenuhnya selektif , bahwa apakah tidak sensitif terhadap zat lain selain analit, dan tidak ada sensitivitas silang yang terjadi.
AD McNaught und A. Wilkinson, eds .: Kompendium Terminologi Kimia ("Buku Emas"). Blackwell Scientific, 1997. ISBN: 0-9678550-9-8. DOI: doi: 10.1351 / goldbook. URL: http://goldbook.iupac.org/ .
Analogi sensitivitas dan spesifisitas untuk hasil yang berkelanjutan
Di sisi lain, jika sifat dasar masalahnya adalah klasifikasi, Anda mungkin dapat menggambarkannya dengan lebih baik melalui regresi:
- regresi menggambarkan tingkat kepemilikan kelas (seperti pada set fuzzy).
- model regresi (posterior) probabilitas beloning ke kelas (seperti dalam regresi logistik )
- kasing Anda dapat digambarkan sebagai campuran dari kelas murni (sangat dekat dengan regresi "normal", contoh kontaminasi di atas)
Untuk kasus-kasus ini, masuk akal untuk memperluas konsep di balik sensitivitas dan spesifisitas menjadi "pengklasifikasi hasil berkelanjutan". Ide dasarnya adalah untuk menimbang setiap kasus sesuai dengan tingkat kepemilikannya pada kelas yang bersangkutan. Untuk sensitivitas dan spesifisitas yang merujuk pada label referensi, untuk nilai prediktif ke keanggotaan kelas yang diprediksi. Ternyata ini mengarah ke hubungan yang sangat dekat dengan ukuran kinerja tipe regresi.
Kami baru-baru ini menggambarkan ini dalam
C. Beleites, R. Salzer dan V. Sergo:
Validasi Model Klasifikasi Lunak menggunakan Keanggotaan Kelas Parsial: Konsep Diperpanjang Sensitivitas & Co diterapkan untuk Grading Jaringan Astrocytoma
Chemom. Intell. Laboratorium. Syst., 122 (2013), 12 - 22.
Tautan tersebut menunjuk ke halaman utama paket R yang menerapkan langkah-langkah kinerja yang diusulkan.
Sekali lagi, contoh tekanan darah IMHO tidak cukup dijelaskan sebagai masalah klasifikasi. Namun, Anda mungkin masih ingin membaca koran - saya pikir perumusan nilai referensi di sana akan memperjelas bahwa tekanan darah tidak dijelaskan secara masuk akal dengan cara yang sesuai untuk klasifikasi.
(Jika Anda merumuskan tingkat "tekanan darah tinggi" terus menerus yang akan menjadi model, dan berbeda dari masalah yang Anda jelaskan.)
Saya hanya melihat sekilas pada makalah yang Anda tautkan, tetapi jika saya mengerti dengan benar, penulis menggunakan ambang (dikotomi) untuk kedua strategi pemodelan: untuk prediksi terus-menerus diproses lebih lanjut: interval prediksi dihitung dan dibandingkan dengan beberapa ambang batas. Pada akhirnya, mereka memiliki prediksi dikotomis, dan menghasilkan ROC dengan memvariasikan spesifikasi untuk interval.
Ketika Anda menentukan bahwa Anda ingin menghindari ini, makalah ini tampaknya tidak terlalu relevan.