Sampel populasi acak disurvei. Mereka ditanya apakah mereka makan diet vegetarian. Jika mereka menjawab ya, mereka juga diminta untuk menentukan berapa lama mereka telah makan diet vegetarian tanpa gangguan. Saya ingin menggunakan data ini untuk menghitung panjang rata-rata kepatuhan pada vegetarian. Dengan kata lain, ketika seseorang menjadi vegetarian, saya ingin tahu lama rata-rata mereka tetap vegetarian. Mari kita asumsikan bahwa:
- Semua responden memberikan tanggapan yang benar dan akurat
- Dunia stabil: popularitas vegetarian tidak berubah, panjang rata-rata kepatuhan juga tidak berubah.
Alasan saya sejauh ini
Saya merasa terbantu untuk menganalisis model mainan dunia, di mana pada awal setiap tahun dua orang menjadi vegetarian. Setiap kali, satu dari mereka tetap vegetarian selama 1 tahun dan yang lain selama 3 tahun. Jelas, panjang rata-rata kepatuhan di dunia ini adalah (1 + 3) / 2 = 2 tahun. Berikut adalah grafik yang menggambarkan contohnya. Setiap kotak mewakili periode vegetarianisme:
Katakanlah kita melakukan survei pada pertengahan tahun 4 (garis merah). Kami mendapatkan data berikut:
Kami akan mendapatkan data yang sama jika kami mengambil survei di tahun apa pun, mulai tahun 3. Jika kami hanya meratakan respons yang kami dapatkan:
(2 * 0,5 + 1,5 + 2,5) / 4 = 1,25
Kami meremehkan karena kami menganggap bahwa semua orang berhenti menjadi vegetarian setelah survei, yang jelas-jelas salah. Untuk memperoleh perkiraan yang lebih dekat dengan waktu rata-rata sebenarnya dimana para peserta ini akan tetap vegetarian, kita dapat mengasumsikan bahwa rata-rata, mereka melaporkan waktu sekitar setengah dari periode vegetarianisme mereka dan melipatgandakan durasi yang dilaporkan dengan 2. Dalam survei besar, menggambar secara acak dari populasi (seperti yang saya analisis), saya pikir ini adalah asumsi yang realistis. Setidaknya itu akan memberikan nilai yang diharapkan benar. Namun, jika menggandakan adalah satu-satunya hal yang kita lakukan, kita mendapatkan rata-rata 2,5, yang merupakan perkiraan terlalu tinggi. Ini karena semakin lama orang tetap vegetarian, semakin besar kemungkinan dia akan menjadi sampel vegetarian saat ini.
Saya kemudian berpikir bahwa kemungkinan seseorang dalam sampel vegetarian saat ini sebanding dengan panjangnya vegetarianisme. Untuk menjelaskan bias ini, saya mencoba untuk membagi jumlah vegetarian saat ini dengan prediksi panjang kepatuhan mereka:
Namun, ini memberikan rata-rata yang salah juga:
(2 * 1 + ⅓ * 3 + ⅕ * 5) / (2 + ⅓ + ⅕) = 4 / 2.533333 = 1,579 tahun
Ini akan memberikan perkiraan yang tepat jika jumlah vegetarian dibagi dengan panjang kepatuhan yang benar:
(1 + ⅓ * (1 + 3 + 5)) / (1 + ⅓ * 3) = 2 tahun
Tapi itu tidak berhasil jika saya menggunakan panjang kepatuhan yang diprediksi dan itu semua yang saya miliki dalam kenyataan. Saya tidak tahu harus mencoba apa lagi. Saya membaca sedikit tentang analisis survival tetapi saya tidak yakin bagaimana menerapkannya dalam kasus ini. Idealnya, saya juga ingin dapat menghitung interval kepercayaan 90%. Setiap tips akan sangat dihargai.
EDIT: Mungkin saja pertanyaan di atas tidak memiliki jawaban. Tetapi ada juga penelitian lain yang menanyakan sampel acak orang-orang apakah mereka vegetarian dan berapa kali mereka menjadi vegetarian di masa lalu. Saya juga tahu usia semua orang dalam studi dan beberapa hal lainnya. Mungkin informasi ini dapat digunakan bersamaan dengan survei vegetarian saat ini untuk mendapatkan nilai tengah. Pada kenyataannya, penelitian yang saya bicarakan hanyalah satu bagian dari teka-teki, tetapi yang sangat penting dan saya ingin mendapatkan lebih banyak darinya.