Masalah yang saya hadapi adalah memprediksi nilai deret waktu. Saya melihat satu seri waktu pada satu waktu dan berdasarkan misalnya 15% dari data input, saya ingin memprediksi nilai-nilai masa depannya. Sejauh ini saya telah menemukan dua model:
- LSTM (memori jangka pendek; kelas jaringan saraf berulang)
- ARIMA
Saya sudah mencoba keduanya dan membaca beberapa artikel tentang mereka. Sekarang saya mencoba untuk lebih memahami cara membandingkan keduanya. Apa yang saya temukan sejauh ini:
- LSTM bekerja lebih baik jika kita berurusan dengan sejumlah besar data dan data pelatihan yang cukup tersedia, sementara ARIMA lebih baik untuk kumpulan data yang lebih kecil (apakah ini benar?)
- ARIMA membutuhkan serangkaian parameter
(p,q,d)
yang harus dihitung berdasarkan data, sedangkan LSTM tidak memerlukan pengaturan parameter tersebut. Namun, ada beberapa hiperparameter yang perlu kita sesuaikan dengan LSTM. - EDIT: Satu perbedaan utama antara keduanya yang saya perhatikan saat membaca artikel yang bagus di sini , adalah bahwa ARIMA hanya dapat bekerja dengan baik pada seri waktu stasioner (di mana tidak ada musim, tren, dll.) Dan Anda harus mengurusnya jika ingin menggunakan ARIMA
Selain properti yang disebutkan di atas, saya tidak dapat menemukan poin atau fakta lain yang dapat membantu saya memilih model terbaik. Saya akan sangat berterima kasih jika seseorang dapat membantu saya menemukan artikel, makalah atau hal-hal lain (sejauh ini tidak beruntung, hanya beberapa pendapat umum di sana-sini dan tidak ada yang didasarkan pada eksperimen.)
Saya harus menyebutkan bahwa awalnya saya berurusan dengan data streaming, namun untuk saat ini saya menggunakan dataset NAB yang mencakup 50 dataset dengan ukuran maksimum 20k titik data.