Struktur data dan pemanggilan fungsi untuk data peristiwa berulang dengan variabel tergantung waktu


9

Saya mencoba memperkirakan efek 2 obat ( drug1, drug2) pada kemungkinan pasien jatuh ( event). Para pasien dapat terjatuh lebih dari satu kali dan dapat memakai atau melepas obat kapan saja.

Pertanyaan saya adalah bagaimana data harus disusun berkaitan dengan periode waktu (hari), khususnya apakah perlu ada tumpang tindih antara hari-hari. Ada dua alasan mengapa saya pikir struktur saya salah, yang pertama tampaknya salah N. Saya juga mendapatkan beberapa kesalahan di mana periode waktu adalah satu hari (yaitu time1=4, time2=4) dan tidak yakin bagaimana ini harus dikodekan. Haruskah waktu mulai entri berikutnya menjadi waktu berhenti dari entri sebelumnya? Saya sudah mencoba keduanya (dengan dan tanpa tumpang tindih), dan meskipun tumpang tindih menghilangkan peringatan, Nitu masih salah.

Warning message:
In Surv(time = c(0, 2, 7, 15, 20, 0, 18, 27, 32, 35, 39, 46, 53,  :
  Stop time must be > start time, NA created

Saat ini saya sudah menyiapkan data di mana awal entri berikutnya adalah hari berikutnya. Pasien unik diidentifikasi oleh mereka chart numbers.

Time1    Time2    Drug1    Drug2   Event    ChartNo
    0        2        1        0       0        123
    3       10        1        1       1        123
   11       14        1        1       1        123
    0       11        0        1       0        345
    0       19        1        0       1        678
    0        4        0        1       0        900
    5       18        1        1       0        900

Pasien 123 menggunakan narkoba1 pada awal hari ke 2, setelah itu mereka menambahkan obat2. Mereka beralih dari hari ke 3 ke hari ke 10 pada kedua obat sebelum jatuh pertama kali, kemudian jatuh untuk kedua kalinya pada hari ke 14 sementara masih menggunakan kedua obat tersebut. Pasien 345 menjalani 11 hari dengan obat2 tanpa jatuh (kemudian disensor), dll.

Estimasi sebenarnya terlihat seperti ini:

S <- Srv(time=time1, time2=time2, event=event)
cox.rms <- cph(S ~ Drug1 + Drug2 + cluster(ChartNo), surv=T)

Perhatian utama saya adalah bahwa nuntuk analisis saya dilaporkan 2017(jumlah baris dalam data), ketika dalam kenyataannya saya hanya memiliki 314pasien yang unik. Saya tidak yakin apakah ini normal atau hasil dari beberapa kesalahan yang saya buat di sepanjang jalan.

> cox.rms$n
Status
No Event    Event 
    1884      133 

Hal yang sama berlaku ketika menggunakan coxph()dari paket survival.

 n= 2017, number of events= 133

Namun jumlah acara sudah benar.

Posting ini tampaknya sudah diatur dengan 'tumpang tindih' yang saya jelaskan, tetapi saya tidak yakin tentang itu N, dan mereka tampaknya tidak mengelompok oleh ID.


The +cluster(ChartNo)Istilah harus mengurus kepedulian pengamatan berulang. Pendekatan alternatif adalah menambahkan + (1|subject)analisis coxme :: coxme.
DWin

Jawaban:


1

Pemformatan data Anda sudah benar.

Anda memiliki banyak catatan per pasien karena kejadian berulang dan kompleksitas tambahan dari obat menjadi kovariat yang bervariasi waktu. Output yang Anda cetak gunakan headsangat membantu untuk memahami data ini.

Pendekatan khas untuk menganalisis kejadian berulang serta kovariat yang bervariasi waktu, adalah memformat data dalam format "panjang" di mana setiap baris mewakili interval pengamatan kovariat risiko. Sebagai contoh, kita melihat pasien 123 menggunakan Drug1 sendiri dari waktu 0 hingga waktu 2, kemudian perubahan untuk mengambil kedua obat 1 dan obat 2 dari waktu 3. Pada saat itu, mereka tidak mengalami jatuh, jadi pengamatan mereka dari 0-2 disensor pada saat itu karena kita tidak tahu berapa lama kejatuhan mereka akan datang jika mereka terus menggunakan Narkoba 1 saja. Pada waktu 3 mereka dimasukkan kembali ke dalam kohort yang dikodekan sebagai pasien yang menggunakan kedua obat untuk 7 unit waktu setelah mereka mengalami kejatuhan pertama mereka. Mereka mengalami penurunan kedua pada kombinasi obat yang sama hanya 4 unit waktu setelahnya.

Jumlah rekaman bukanlah ringkasan yang berguna dari data kohort. Tidak mengherankan jumlah baris jauh lebih besar dari jumlah pasien. Alih-alih, jumlah waktu dari awal hingga berhenti dan catat sebagai jumlah orang-waktu-berisiko. Kohort-penyebut berguna untuk memahami kejadian. Berguna juga untuk merangkum jumlah pasien, tetapi ingat bahwa datanya dalam format "panjang" sehingga kurang dari jumlah baris dalam dataset Anda.

Untuk kesalahan, saya pikir Anda mungkin perlu menambahkan 1 unit ke tanggal "berhenti". Jika pasien 123 menggunakan obat 1 untuk hari 0, 1, dan 2 dan kemudian mulai obat 2 pada hari 3, maka mereka mengalami 3 hari berisiko untuk jatuh pada obat 1. Namun, 2-0 = 2 dan itu tidak benar penyebut.

Apa yang dilakukan argumen "gugus" (biasanya) adalah suatu kelemahan, yang merupakan jenis intersepsi acak yang menjelaskan apa yang mungkin merupakan perbedaan risiko proporsional yang disebabkan oleh beberapa faktor risiko yang tidak terukur. Saya tidak sering melakukan analisis dengan kelemahan. Anda dapat menghilangkan perintah "cluster" dan menafsirkan hasil sebagai rasio kejadian. Anda dapat secara bergantian menyesuaikan model cox untuk saat itu hingga musim gugur pertama pada semua pasien dan menafsirkan rasio bahaya sebagai rasio risiko. Saya pikir hasil kelemahan harus jatuh di suatu tempat di antara keduanya, dan saya tidak pernah cukup jelas apa interpretasinya.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.