Misalkan penyakit tertentu () memiliki prevalensi . Juga anggaplah suatu gejala tertentu () memiliki prevalensi (pada populasi umum = orang dengan penyakit ituD dan orang-orang tanpa penyakit itu [mungkin dengan penyakit lain, tetapi itu tidak penting]) dari . Dalam penelitian sebelumnya, ditemukan bahwa probabilitas bersyarat (probabilitas untuk memiliki gejala , mengingat penyakitnya adalah ).
Pertanyaan pertama : Bisa jadi diartikan setara dengan prevalensi gejala pada kelompok orang yang menderita penyakit tersebut ?
Pertanyaan kedua : Saya ingin membuat dalam R dataset, yang menunjukkan bahwa:
Bagaimana cara melakukannya? Jika saya menggunakan samplefungsi saja, dataset saya kurang informasi itu:
symptom <- sample(c("yes","no"), 1000, prob=c(0.005, 0.995), rep=T)
disease <- sample(c("yes","no"), 1000, prob=c(0.002, 0.998), rep=T)
Jadi pertanyaan saya adalah: bagaimana cara membuat dataset yang baik, termasuk probabilitas bersyarat yang saya inginkan?
EDIT : Saya memposting pertanyaan yang sama juga di stackoverflow.com ( /programming/7291935/how-to-create-a-dataset-with-conditional-probability ), karena, menurut pendapat saya, pertanyaan saya diwarisi untuk program bahasa R, tetapi juga untuk teori statistik.