Memperkirakan variabilitas dari waktu ke waktu

Saya memiliki dataset yang berisi ~ 7.500 tes darah dari ~ 2.500 orang. Saya mencoba mencari tahu apakah variabilitas dalam tes darah meningkat atau menurun dengan waktu antara dua tes. Sebagai contoh - Saya mengambil darah Anda untuk tes dasar, kemudian segera mengambil sampel kedua. Enam bulan kemudian, saya mengambil sampel lain. Seseorang mungkin mengharapkan perbedaan antara baseline dan tes pengulangan langsung menjadi lebih kecil daripada perbedaan antara baseline dan tes enam bulan.

Setiap titik pada plot di bawah ini mencerminkan perbedaan antara dua tes. X adalah jumlah hari antara dua tes; Y adalah ukuran perbedaan antara dua tes. Seperti yang Anda lihat, tes tidak didistribusikan secara merata di sepanjang X - penelitian ini tidak dirancang untuk menjawab pertanyaan ini, sungguh. Karena titik-titik tersebut sangat banyak ditumpuk pada rata-rata, saya telah menyertakan 95% (biru) dan 99% (merah) garis kuantil, berdasarkan pada jendela 28-hari. Ini jelas ditarik oleh poin yang lebih ekstrim, tetapi Anda mendapatkan idenya.

alt teks http://a.imageshack.us/img175/6595/diffsbydays.png

Sepertinya variabilitasnya cukup stabil. Jika ada, itu lebih tinggi ketika tes diulang dalam waktu singkat - itu sangat berlawanan dengan intuisi. Bagaimana saya bisa mengatasinya dengan cara yang sistematis, memperhitungkan berbagai n pada setiap titik waktu (dan beberapa periode tanpa tes sama sekali)? Ide-ide Anda sangat dihargai.

Hanya untuk referensi, ini adalah distribusi jumlah hari antara tes dan tes ulang:

alt teks http://a.imageshack.us/img697/6572/testsateachtimepoint.png

repeated-measures variability

— Matt Parker
sumber

+1 untuk kasus nyata yang menarik! dapatkah Anda membantu kami untuk memahami apa itu tes darah? (bagaimana Anda menghitungnya)

— robin girard

Ada sebuah artikel tentang LFT (tes fungsi hati) dan bagaimana tampaknya bervariasi dalam basis siklik (dalam beberapa bulan). Saya pikir itu dalam Annals of Internal Medicine.

— Ming K

Tentu - secara singkat, ini adalah tes untuk infeksi TB laten. Darah diambil dari pasien menjadi tiga tabung: satu yang tidak memiliki antigen, satu yang telah memilih antigen TB, dan satu yang memiliki mitogen. Kami kemudian membandingkan jumlah tanggapan imunologis dalam tabung tanpa antigen dengan yang dengan TB - jika mereka memiliki dorongan yang kuat dalam tabung TB, mereka mungkin memiliki TB laten. (Tabung mitogen berfungsi sebagai cek untuk memastikan bahwa orang tersebut mampu menghasilkan respons imunologis sama sekali - kebanyakan orang memiliki reaksi yang sangat kuat terhadapnya)

— Matt Parker

Dari uraian Anda, saya tidak dapat melihat alasan untuk membedakan "tes awal" dari "sampel kedua" yang diambil langsung. Mereka hanya 2 pengukuran dasar dan varians (pada awal) dapat dihitung atas dasar itu. Akan lebih baik merencanakan rata-rata dari dua pengukuran dasar dibandingkan sampel "enam bulan" ketiga.

Masalahnya dengan sampel 6 bulan. Karena hanya satu sampel yang diambil pada titik ini, tidak ada cara untuk memperkirakan "variabilitas" pada titik ini, atau lebih tepatnya memisahkan variasi sampel dari perubahan longitudinal (nyata) dalam pembacaan TB.

Jika kita menganggap ini sebagai masalah analisis data longitudinal, kita mungkin akan memilih intersep acak (TB awal) dan kemiringan acak (agar sesuai dengan TB 6 bulan). Variabilitas pengambilan sampel akan diperkirakan dari dua pengukuran dasar dan kemiringan dari ukuran 6 bulan ketiga. Kami tidak dapat memperkirakan variabilitas pada 6 bulan tanpa asumsi distribusi yang kuat pada chnage selama enam bulan tersebut, seperti mengasumsikan tidak ada perubahan.

— Thylacoleo
sumber