Mengapa prediksi deret waktu ini “sangat buruk”?

Saya mencoba mempelajari cara menggunakan Neural Networks. Saya sedang membaca tutorial ini .

Setelah memasang Neural Network pada Time Series menggunakan nilai pada untuk memprediksi nilai pada penulis memperoleh plot berikut, di mana garis biru adalah seri waktu, hijau adalah prediksi pada data kereta, merah adalah prediksi pada data uji (ia menggunakan tes-kereta split) $t$ $t+1$

dan menyebutnya "Kita bisa melihat bahwa model melakukan pekerjaan yang sangat buruk untuk menyesuaikan baik pelatihan dan dataset uji. Pada dasarnya memperkirakan nilai input yang sama dengan output."

$t$ $t-1$ $t-2$ $t+1$

dan mengatakan "Melihat grafik, kita dapat melihat lebih banyak struktur dalam prediksi."

Pertanyaan saya

Mengapa "miskin" pertama? itu terlihat hampir sempurna bagiku, ia memprediksi setiap perubahan dengan sempurna!

Dan juga, mengapa yang kedua lebih baik? Di mana "struktur" itu? Bagi saya itu tampak jauh lebih miskin daripada yang pertama.

Secara umum, kapan prediksi tentang deret waktu baik dan kapan itu buruk?

— Euler_Salter
sumber

Sebagai komentar umum, sebagian besar metode ML adalah untuk analisis cross-sectional, dan perlu penyesuaian untuk diterapkan untuk deret waktu. Alasan utama adalah autokorelasi dalam data, sedangkan dalam ML sering data dianggap independen dalam metode yang paling populer

— Aksakal

Itu pekerjaan yang baik untuk memprediksi setiap perubahan ... tepat setelah itu terjadi!

— hobbs

@ hobbs, saya tidak mencoba menggunakan t, t-1, t-2 dll untuk memprediksi t +1. Saya bertanya-tanya apakah Anda tahu berapa banyak istilah di masa lalu yang terbaik untuk digunakan. Jika kita menggunakan terlalu banyak, apakah kita terlalu cocok?

— Euler_Salter

Akan lebih mencerahkan untuk merencanakan residu.

— reo katoa

Jawaban:

Ini semacam ilusi optik: mata melihat grafik, dan melihat bahwa grafik merah dan biru tepat di sebelah masing-masing. Masalahnya adalah mereka berada tepat di sebelah satu sama lain secara horizontal , tetapi yang penting adalah vertikaljarak. Mata paling mudah melihat jarak antara kurva dalam ruang dua dimensi dari grafik Cartesian, tetapi yang penting adalah jarak satu dimensi dalam nilai t tertentu. Sebagai contoh, misalkan kita memiliki poin A1 = (10.100), A2 = (10.1, 90), A3 = (9.8.85), P1 = (10.1.100.1), dan P2 = (9.8, 88). Mata secara alami akan membandingkan P1 dengan A1, karena itu adalah titik terdekat, sedangkan P2 akan dibandingkan dengan A2. Karena P1 lebih dekat ke A1 daripada P2 ke A3, P1 akan terlihat seperti prediksi yang lebih baik. Tetapi ketika Anda membandingkan P1 dengan A1, Anda hanya melihat seberapa baik A1 mampu mengulangi apa yang dilihatnya sebelumnya; sehubungan dengan A1, P1 bukan prediksi. Perbandingan yang tepat adalah antara P1 v. A2, dan P2 v. A3, dan dalam perbandingan ini P2 lebih baik daripada P1. Akan lebih jelas jika, selain memplot y_actual dan y_pred terhadap t, sudah ada grafik (y_pred-y_actual) terhadap t.

— Akumulasi
sumber

Ini adalah jawaban yang lebih baik karena yang lain bahkan tidak menyebutkan mengapa ramalan "tampan" sebenarnya buruk, sementara Anda melakukan pekerjaan dengan baik!

— Richard Hardy

Mengapa "miskin" pertama? itu terlihat hampir sempurna bagiku, ia memprediksi setiap perubahan dengan sempurna!

Ini adalah ramalan yang disebut "bergeser". Jika Anda melihat lebih dekat pada grafik 1, Anda melihat bahwa kekuatan prediksi hanya dalam menyalin hampir persis nilai terakhir yang terlihat. Itu berarti model tidak belajar yang lebih baik, dan itu memperlakukan deret waktu sebagai jalan acak. Saya kira masalahnya mungkin karena Anda menggunakan data mentah yang Anda berikan ke jaringan saraf. Data-data ini tidak stasioner yang menyebabkan semua masalah.

— Alexey Burnakov
sumber

Dalam peramalan ini disebut ramalan "naif", yaitu menggunakan ramalan terakhir yang diamati

— Aksakal

Terima kasih! @Aksakal, Anda tahu berapa banyak nilai sebelumnya yang harus digunakan untuk prediksi?

— Euler_Salter

Fokus pada stasioneritas. Beberapa keterlambatan stasioner harus cukup baik untuk seri waktu ini. Lebih baik dari 100 lag yang tidak stasioner

— Alexey Burnakov

dalam deret waktu ada cara untuk mendapatkan tebakan yang baik tentang struktur lag melalui ACF dan PACF, lihat forum ini, ada banyak posting tentang bagaimana hal itu dilakukan

— Aksakal

@AlexeyBurnakov jadi apakah itu berarti saya harus mengubahnya menjadi stasioner?

— Euler_Salter