Analisis garis waktu


10

Saya sedang melakukan penelitian tentang hubungan antara urutan kelahiran seseorang dan risiko obesitas di kemudian hari menggunakan data dari beberapa kohort kelahiran 1 tahun (mis. Http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).

Tantangan utama adalah bahwa urutan kelahiran terkait dengan fitur-fitur lain seperti usia ibu, jumlah saudara kandung yang lebih muda dan / atau lebih tua, dan jarak kelahiran, yang juga dapat mempengaruhi hasil melalui mekanisme yang berbeda. Selanjutnya, segala pengaruh hal-hal ini terhadap risiko obesitas nanti dapat dimodifikasi oleh komposisi jenis kelamin saudara kandung, termasuk "anak indeks" (peserta dalam kelompok kelahiran).

Untuk setiap anak indeks, orang dapat menggambar garis waktu yang menunjukkan semua kelahiran dalam keluarga, dengan usia ibu pada variabel waktu.

masukkan deskripsi gambar di sini

Saya mencoba mengidentifikasi metode untuk menganalisis jenis data ini, di mana urutan, waktu, dan sifat kejadian semua mungkin penting. Saya mengajukan pertanyaan ini di sini karena keragaman aplikasi yang digunakan anggota - Saya berharap seseorang memiliki beberapa saran langsung yang akan membuat saya lebih lama untuk mengidentifikasi sendiri. Setiap dorongan ke arah yang benar akan sangat dihargai.

Pertanyaan terkait: Bagaimana saya harus menganalisis data tentang interval kelahiran perempuan?


1
+1. Pertanyaan yang biasa: sudahkah Anda mendapatkan data untuk BMI orang tua?
Deer Hunter

Ya, ada beberapa data antropometrik longitudinal untuk ibu dari anak-anak indeks. Sayangnya tidak pada saudara kandung, menghalangi setiap vs dalam antara analisis keluarga.
DL Dahly

Tidak banyak pemikiran bermanfaat tentang masalah waktu saat ini. Anda mungkin ingin memiliki usia ibu saat melahirkan pertama sebagai variabel independen lainnya; Saya berasumsi Anda telah melakukan analisis eksplorasi dan visualisasi ...
Deer Hunter

Jelas usia ibu penting untuk diperhitungkan, itulah sebabnya garis waktu di atas menggunakan usia ibu sebagai variabel waktu. Saya kira apa yang saya harap temukan adalah metode alternatif yang menawarkan lebih dari sekadar membuang semuanya ke dalam model linier.
DL Dahly

Tidak yakin apakah ini penting, tetapi saya akan berpikir bahwa berat lahir, atau berat lahir rata-rata anak-anak perempuan mungkin merupakan kovariat yang menarik. Juga, dapatkah Anda memberikan lebih banyak informasi tentang hasil Anda? Apakah Anda sudah mengulangi tindakan?
Riset Andal

Jawaban:


2

Anda mungkin mempertimbangkan untuk menggunakan model bertingkat (regresi berganda) untuk memperkirakan antara dan di dalam efek keluarga. Salah satu strategi yang mungkin adalah dengan menggunakan pendekatan pembangunan model hierarkis yang terencana. Misalnya, uji setiap calon penaksir dalam model univariat. Jika antara efek keluarga menghapus efek urutan kelahiran, maka itu akan sangat menyarankan urutan kelahiran tidak penting tetapi pengaruh lainnya. Contoh kutipan untuk efek urutan kelahiran ini pada IQ:

Saya harap ini membantu.


+1 untuk ide bagus yang saya temui juga, tetapi saya tidak memiliki data hasil tentang saudara kandung untuk analisis khusus ini.
DL Dahly

0

Saya mendekati ini sebagai pertanyaan statistik dan tidak memiliki pengetahuan khusus tentang masalah medis.

Melihat artikel yang Anda rujuk, saya melihat bahwa satu kelompok berisi 970 orang. Jika Anda memiliki data pada beberapa kohort dengan ukuran yang kira-kira sama, maka ukuran keseluruhan dataset Anda menawarkan kesempatan untuk memilih subset yang cukup besar di mana garis waktu masing-masing individu memenuhi kondisi tertentu. Misalnya, subset mungkin mencakup, katakanlah, semua individu pria dengan usia ibu 25-29. Regresi, untuk subset seperti itu, dari ukuran yang sesuai dari obesitas di kemudian hari terhadap urutan kelahiran akan menghilangkan efek yang mungkin terjadi pada obesitas di kemudian hari dari perbedaan jenis kelamin anak indeks dan sebagian besar menghilangkan segala kemungkinan dampak usia ibu.

Tidak mudah untuk memperluas pendekatan ini ke jenis kelamin saudara kandung karena jika satu syarat untuk subset adalah, katakanlah, bahwa anak indeks memiliki saudara perempuan yang lebih tua, yang menyiratkan bahwa anak indeks itu sendiri bukan anak tertua, mempersempit kisaran. dari variabel independen dalam regresi. Namun, satu jalan memutar untuk menentukan kondisi menggunakan "jika ada". Misalnya, subset dapat didefinisikan untuk memasukkan semua individu pria dengan usia ibu 25-29 dan dengan saudara yang lebih tua, jika ada, semua wanita. Subset seperti itu masih akan mencakup individu dengan urutan kelahiran apa pun.

Jika himpunan bagian didefinisikan oleh sekumpulan kondisi yang terlalu rumit, maka jumlah individu yang dikandungnya mungkin sangat kecil sehingga estimasi koefisien yang dihasilkan akan terlalu tidak tepat untuk berguna. Jika pendekatan ini diadopsi, mungkin akan ada kebutuhan untuk trade-off penilaian, dalam mendefinisikan himpunan bagian, antara menghilangkan efek sebanyak mungkin dan termasuk individu yang cukup untuk menghasilkan hasil yang bermanfaat.


Terima kasih atas jawabannya, Adam. Namun dalam kasus ini, saya tidak berpikir stratifikasi sampel akan memberi tahu Anda apa pun di luar model yang disesuaikan serupa. Sangat mungkin bahwa model linier yang ditentukan dengan benar adalah cara terbaik untuk melakukan ini ... Saya hanya berharap untuk melihat apakah ahli statistik di bidang lain menangani masalah serupa dengan cara yang berbeda.
DL Dahly

Saya setuju - jika ini yang Anda katakan - bahwa pendekatan saya setara dengan satu regresi pada seluruh dataset menggunakan berbagai variabel indikator. Mengambil usia ibu sebagai contoh, masalah potensial dengan model apa pun yang memperlakukannya sebagai variabel kontinu adalah bahwa ia memerlukan asumsi pada bentuk fungsional (hubungan antara usia ibu dan obesitas kemudian mungkin melengkung). Sebaliknya, model yang menggunakan seperangkat variabel indikator untuk pita usia ibu tidak memerlukan asumsi seperti itu dan dalam hal itu lebih umum.
Adam Bailey

0

Saya akan menyarankan analisis data fungsional tetapi saya curiga Anda mungkin memiliki banyak keluarga dengan terlalu sedikit anak untuk mendapatkan perkiraan yang masuk akal. Teruskan dan baca saja, karena ini memenuhi kebutuhan Anda. Mungkin seseorang sudah menggunakannya dengan data serupa.

Jika Anda tidak ingin melakukan sesuatu yang sangat tidak parametrik seperti itu, Anda harus menggunakan keahlian klinis Anda untuk mengurangi dimensi data. Misalnya, satu variabel dalam model Anda bisa jumlah anak, yang lain bisa jumlah rata-rata tahun antara anak-anak, dan sebagainya. Jika ada efek dalam variabel-variabel ini, itu mungkin muncul bahkan jika Anda belum menentukan bentuk fungsional dengan segera. Pembuatan model berbasis pengetahuan lebih lanjut memungkinkan Anda untuk membangun model yang sangat prediktif - pastikan Anda menyimpan set validasi!


Saya menggunakan FDA dan tidak yakin bagaimana ini berlaku. Saya dapat mengatur sumbu x = 0 untuk setiap anak indeks, dan saudara kandung lainnya diplot pada +/- waktu pada sumbu itu; dan memiliki usia ibu sebagai sumbu y; dan kemudian memperkirakan objek data fungsional monoton untuk setiap anak indeks ... tapi begitu saya selesai melakukan ini, saya kehilangan semua informasi tentang jumlah sebenarnya saudara kandung dan di mana mereka berada di sepanjang garis (karena semuanya sekarang dirangkum oleh fungsi). FDA mencakup sejumlah mode analisis - apakah Anda memiliki sesuatu yang lebih spesifik dalam pikiran?
DL Dahly
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.