Saya baru di halaman dan cukup baru dalam statistik dan R. Saya sedang mengerjakan proyek untuk kuliah dengan tujuan menemukan korelasi antara hujan dan tingkat aliran air di sungai. Setelah korelasinya terbukti, saya ingin memperkirakan / memprediksinya.
Data yang saya punya satu set data beberapa tahun (diambil setiap 5 menit) untuk sungai tertentu yang mengandung:
- Curah hujan dalam milimeter
- Sungai mengalir dalam meter kubik per detik
Sungai ini tidak memiliki salju, jadi modelnya hanya didasarkan pada hujan dan waktu. Kadang-kadang ada suhu yang sangat dingin, tetapi saya berpikir untuk menghapus periode-periode itu dari data sebagai pencilan karena situasi itu di luar ruang lingkup proyek saya.
Contoh Di sini Anda memiliki beberapa plot sampel data dari hujan dan kenaikan air beberapa jam kemudian.
Garis merah adalah aliran sungai. Jeruk adalah hujan. Anda bisa melihatnya selalu hujan sebelum air naik di sungai. Ada beberapa hujan mulai lagi di akhir deret waktu, tetapi itu akan mempengaruhi aliran sungai nanti.
Korelasi ada di sana. Inilah yang saya lakukan di R untuk membuktikan korelasi menggunakan ccf di R:
- korelasi silang
- variabel terkemuka
- lag
Ini adalah garis R saya yang digunakan untuk contoh kedua (satu periode hujan):
ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")
Interpretasi saya adalah:
- bahwa hujan mengarah (terjadi lebih dulu),
ccf
Apakah saya benar?
Tentang deret waktu . Rangkaian waktu ini tidak memiliki periodisitas atau musim. Hujan bisa datang kapan saja dan menimbulkan efek. Memang berkurang di musim panas, tapi itu masih terjadi, itu adalah daerah dengan banyak hujan sepanjang tahun.
Model dan perkiraan.
Saya tidak tahu cara membuat model untuk dapat melakukan perkiraan yang memberi tahu saya berapa banyak sungai yang akan menambah volume setelah periode hujan. Saya sudah mencoba beberapa arima
, auto arima
tetapi belum terlalu sukses. Haruskah saya menggunakan Arima
, vars
atau model multivarian lain yang berbeda? Setiap tautan ke contoh akan sangat membantu.
Tolong, beri tahu saya jika Anda tahu cara terbaik untuk membuat prediksi ini, model apa yang harus saya gunakan. Ada beberapa hal lain yang saya pertimbangkan lakukan tetapi saya keluarkan dari penjelasan ini untuk kesederhanaan. Saya dapat membagikan beberapa data jika diperlukan.