Saya memiliki dataset yang berisi ~ 7.500 tes darah dari ~ 2.500 orang. Saya mencoba mencari tahu apakah variabilitas dalam tes darah meningkat atau menurun dengan waktu antara dua tes. Sebagai contoh - Saya mengambil darah Anda untuk tes dasar, kemudian segera mengambil sampel kedua. Enam bulan kemudian, saya mengambil sampel lain. Seseorang mungkin mengharapkan perbedaan antara baseline dan tes pengulangan langsung menjadi lebih kecil daripada perbedaan antara baseline dan tes enam bulan.
Setiap titik pada plot di bawah ini mencerminkan perbedaan antara dua tes. X adalah jumlah hari antara dua tes; Y adalah ukuran perbedaan antara dua tes. Seperti yang Anda lihat, tes tidak didistribusikan secara merata di sepanjang X - penelitian ini tidak dirancang untuk menjawab pertanyaan ini, sungguh. Karena titik-titik tersebut sangat banyak ditumpuk pada rata-rata, saya telah menyertakan 95% (biru) dan 99% (merah) garis kuantil, berdasarkan pada jendela 28-hari. Ini jelas ditarik oleh poin yang lebih ekstrim, tetapi Anda mendapatkan idenya.
alt teks http://a.imageshack.us/img175/6595/diffsbydays.png
Sepertinya variabilitasnya cukup stabil. Jika ada, itu lebih tinggi ketika tes diulang dalam waktu singkat - itu sangat berlawanan dengan intuisi. Bagaimana saya bisa mengatasinya dengan cara yang sistematis, memperhitungkan berbagai n pada setiap titik waktu (dan beberapa periode tanpa tes sama sekali)? Ide-ide Anda sangat dihargai.
Hanya untuk referensi, ini adalah distribusi jumlah hari antara tes dan tes ulang:
alt teks http://a.imageshack.us/img697/6572/testsateachtimepoint.png