Dalam bahasa Inggris biasa: Saya memiliki regresi berganda atau model ANOVA tetapi variabel respons untuk setiap individu adalah fungsi waktu yang melengkung.
- Bagaimana saya bisa tahu mana dari variabel sisi kanan bertanggung jawab atas perbedaan signifikan dalam bentuk atau offset vertikal dari kurva?
- Apakah ini masalah rangkaian waktu, masalah tindakan berulang, atau sesuatu yang lain sama sekali?
- Apa praktik terbaik untuk menganalisis data tersebut (lebih disukai dalam
R
, tetapi saya terbuka untuk menggunakan perangkat lunak lain)?
Dalam istilah yang lebih tepat: Katakanlah saya memiliki model tetapi y i j k sebenarnya adalah serangkaian data- poin dikumpulkan dari individu yang sama pada banyak titik waktu , yang dicatat sebagai variabel numerik. Memplot data menunjukkan bahwa untuk setiap individut y i j k tadalah fungsi kuadratik atau siklikal dari waktu yang offset, bentuk, atau frekuensinya vertikal (dalam kasus siklikal) mungkin sangat tergantung pada kovariat. Para kovariat tidak berubah dari waktu ke waktu - yaitu, seorang individu memiliki berat badan yang konstan atau kelompok perlakuan selama durasi periode pengumpulan data.
Sejauh ini saya telah mencoba R
pendekatan berikut :
Manova
Anova(lm(YT~A*B,mydata),idata=data.frame(TIME=factor(c(1:10))),idesign=~TIME);
... di mana
YT
adalah matriks yang kolomnya adalah titik waktu, 10 di antaranya dalam contoh ini, tetapi jauh lebih dalam data nyata.Masalah: ini memperlakukan waktu sebagai faktor, tetapi titik waktu tidak tepat cocok untuk setiap individu. Selain itu, ada banyak dari mereka yang relatif terhadap ukuran sampel sehingga model menjadi jenuh. Sepertinya bentuk variabel respon dari waktu ke waktu diabaikan.
Model campuran (seperti pada Pinheiro dan Bates, Model Efek Campuran dalam S dan S-Plus )
lme(fixed=Y~ A*B*TIME + sin(2*pi*TIME) + cos(2*pi*TIME), data=mydata, random=~(TIME + sin(2*pi*TIME) + cos(2*pi*TIME))|ID), method='ML')
... di mana
ID
faktor yang mengelompokkan data berdasarkan individu. Dalam contoh ini, responsnya bersifat siklis dari waktu ke waktu, tetapi bisa saja ada istilah kuadratik atau fungsi waktu lainnya.Masalah: Saya tidak yakin apakah setiap istilah waktu diperlukan (terutama untuk istilah kuadratik) dan mana yang dipengaruhi oleh kovariat mana.
- Apakah
stepAIC()
metode yang baik untuk memilihnya? - Jika tidak menghapus istilah yang tergantung waktu, apakah itu juga akan menghapusnya dari
random
argumen? - Bagaimana jika saya juga menggunakan fungsi autokorelasi (seperti
corEXP()
) yang mengambil rumus dalamcorrelation
argumen - haruskah saya membuat rumuscorEXP()
itu sama dengan yang ada dirandom
atau hanya~1|ID
? - The
nlme
paket jarang disebutkan dalam konteks time series luar Pinheiro dan Bates ... itu tidak dianggap baik cocok untuk masalah ini?
- Apakah
Menyesuaikan model kuadratik atau trigonometri untuk setiap individu, dan kemudian menggunakan masing-masing koefisien sebagai variabel respons untuk regresi berganda atau ANOVA.
Masalah: Diperlukan beberapa koreksi perbandingan. Tidak dapat memikirkan masalah lain yang membuat saya curiga bahwa saya mengabaikan sesuatu.
Seperti yang disarankan sebelumnya di situs ini ( Apa istilah untuk regresi deret waktu yang memiliki lebih dari satu prediktor? ), Ada ARIMAX dan fungsi transfer / model regresi dinamis .
Masalah: Model berbasis ARMA mengasumsikan waktu diskrit, bukan? Mengenai regresi dinamis, saya mendengarnya untuk pertama kali hari ini, tetapi sebelum saya mempelajari metode baru lain yang mungkin tidak berhasil, saya pikir akan lebih bijaksana untuk meminta orang yang telah melakukan ini sebelumnya untuk meminta nasihat.