Tolong bantu saya di sini. Mungkin bahkan sebelum memberi saya jawaban, Anda mungkin perlu membantu saya mengajukan pertanyaan. Saya tidak pernah belajar tentang analisis deret waktu dan tidak tahu apakah itu memang yang saya butuhkan. Saya tidak pernah belajar tentang waktu yang dihaluskan rata-rata dan tidak tahu apakah itu memang yang saya butuhkan. Latar belakang statistik saya: Saya memiliki 12 sks dalam biostatistik (regresi linier berganda, regresi logistik berganda, analisis survival, anova multi-faktorial tetapi tidak pernah mengulangi pengukuran anova).
Jadi tolong lihat skenario saya di bawah ini. Apa kata kunci yang harus saya cari dan dapatkah Anda menyarankan sumber daya untuk mempelajari apa yang perlu saya pelajari?
Saya ingin melihat beberapa set data yang berbeda untuk tujuan yang sama sekali berbeda tetapi yang umum bagi mereka semua adalah bahwa ada tanggal sebagai satu variabel. Jadi beberapa contoh muncul dalam pikiran: produktivitas klinis dari waktu ke waktu (seperti dalam berapa banyak operasi atau berapa banyak kunjungan kantor) atau tagihan listrik dari waktu ke waktu (seperti dalam uang yang dibayarkan ke perusahaan listrik per bulan).
Untuk kedua hal di atas, cara universal yang paling dekat untuk melakukannya adalah dengan membuat spreadsheet bulan atau kuartal dalam satu kolom dan di kolom lainnya akan menjadi sesuatu seperti pembayaran listrik atau jumlah pasien yang terlihat di klinik. Namun, penghitungan per bulan menyebabkan banyak kebisingan yang tidak memiliki arti. Misalnya, jika saya biasanya membayar tagihan listrik pada tanggal 28 setiap bulan tetapi pada satu kesempatan saya lupa dan jadi saya hanya membayarnya 5 hari kemudian pada tanggal 3 bulan berikutnya maka satu bulan akan muncul seolah-olah tidak ada biaya nol dan bulan depan akan menunjukkan biaya yang sangat besar. Karena seseorang memiliki tanggal pembayaran aktual mengapa seseorang dengan sengaja membuang data yang sangat terperinci dengan memasukkannya ke dalam pengeluaran berdasarkan bulan kalender.
Demikian pula jika saya berada di luar kota selama 6 hari di sebuah konferensi maka bulan itu akan tampak sangat tidak produktif dan jika 6 hari itu jatuh menjelang akhir bulan, bulan berikutnya akan sibuk seperti biasanya karena akan ada daftar tunggu keseluruhan orang yang ingin melihat saya tetapi harus menunggu sampai saya kembali.
Maka tentu saja ada variasi musiman yang jelas. Pendingin udara menggunakan banyak listrik sehingga jelas seseorang harus menyesuaikan dengan panas musim panas. Miliaran anak dirujuk kepada saya untuk otitis media akut berulang di musim dingin dan hampir tidak ada pada musim panas dan awal musim gugur. Tidak ada anak usia sekolah yang dijadwalkan untuk operasi elektif dalam 6 minggu pertama sekolah kembali setelah liburan musim panas yang panjang. Musiman hanyalah satu variabel independen yang memengaruhi variabel dependen. Harus ada variabel independen lainnya yang beberapa di antaranya dapat ditebak dan yang lainnya tidak diketahui.
Sejumlah besar masalah yang berbeda muncul ketika melihat pendaftaran dalam studi klinis yang sudah berlangsung lama.
Cabang statistik apa yang memungkinkan kita melihat ini dari waktu ke waktu dengan hanya melihat peristiwa dan tanggal aktualnya tetapi tanpa membuat kotak buatan (bulan / kuartal / tahun) yang tidak benar-benar ada.
Saya berpikir untuk menghitung rata-rata tertimbang untuk setiap acara. Misalnya jumlah pasien yang terlihat minggu ini sama dengan 0,5 * nr yang terlihat minggu ini + 0,25 * nr yang terlihat minggu lalu + 0,25 * nr yang terlihat minggu depan.
Saya ingin belajar lebih banyak tentang ini. Kata kunci apa yang harus saya cari?