Apa kerugian dari model ruang-negara dan Filter Kalman untuk pemodelan time-series?


53

Mengingat semua sifat yang baik dari model ruang-negara dan KF, saya bertanya-tanya - apa kerugian dari pemodelan ruang-negara dan menggunakan Filter Kalman (atau EKF, UKF atau filter partikel) untuk estimasi? Lebih dari katakanlah metodologi konvensional seperti ARIMA, VAR atau metode ad-hoc / heuristik.

Apakah mereka sulit dikalibrasi? Apakah mereka rumit dan sulit untuk melihat bagaimana perubahan dalam struktur model akan memengaruhi prediksi?

Atau, dengan kata lain - apa keunggulan ARIMA konvensional, VAR dibandingkan model ruang-ruang?

Saya hanya bisa memikirkan keuntungan dari model ruang-negara:

  1. Ini dengan mudah menangani patah struktural, pergeseran, parameter waktu yang bervariasi dari beberapa model statis - cukup buat parameter tersebut keadaan dinamis dari model ruang-ruang dan model akan secara otomatis menyesuaikan diri dengan perubahan dalam parameter;
  2. Ini menangani data yang hilang secara alami, cukup lakukan langkah transisi KF dan jangan lakukan langkah pembaruan;
  3. Hal ini memungkinkan untuk mengubah parameter on-a-fly dari model ruang-negara itu sendiri (kovarian suara dan matriks transisi / pengamatan) jadi jika pengamatan Anda saat ini berasal dari sumber yang sedikit berbeda dari yang lain - Anda dapat dengan mudah memasukkannya ke dalam estimasi tanpa melakukan sesuatu yang istimewa;
  4. Menggunakan properti di atas memungkinkan mudah menangani data spasi tidak teratur: baik mengubah model setiap kali sesuai interval antara pengamatan atau menggunakan interval reguler dan memperlakukan interval tanpa pengamatan sebagai data yang hilang;
  5. Memungkinkan untuk menggunakan data dari berbagai sumber secara bersamaan dalam model yang sama untuk memperkirakan satu kuantitas yang mendasarinya;
  6. Hal ini memungkinkan untuk membangun sebuah model dari beberapa diinterpretasi komponen dinamis unobservable dan memperkirakan mereka;
  7. Setiap model ARIMA dapat direpresentasikan dalam bentuk ruang-negara, tetapi hanya model ruang-negara sederhana yang dapat direpresentasikan secara tepat dalam bentuk ARIMA.

1
JFew keuntungan tambahan, seperti yang disebutkan di poin pertama Anda, dapat dengan mudah menggabungkan beberapa shift dan outlier level. Dalam pengalaman saya istirahat struktural dapat dengan mudah diidentifikasi dengan ruang negara daripada ARIMA. Juga dapat dengan mudah menggabungkan efek nonlinear dari variabel eksogen. Tidak memerlukan data deret waktu menjadi stasioner yang merupakan + besar.
peramal

2
Yah saya akan mengambil model ruang negara atas ARIMA kapan saja. Saya dapat memikirkan dua kelemahan (semacam): a) model ruang keadaan yang sesuai dari model ARIMA memiliki banyak nol yang tidak perlu dalam matriks desain. Orang mungkin berpendapat bahwa ARIMA lebih kompak. b) ada model non-linear / non-gaussian yang jarang memiliki bentuk analitis yang kadang-kadang dapat dijelaskan dalam bentuk ARIMA, tetapi akan sulit dalam ruang keadaan tradisional.
Cagdas Ozgenc

2
@Kochede Durbin dan Koopman tampaknya tidak bisa memikirkan banyak kerugian juga - mereka menyebutkan dua di bagian bawah halaman 52 dalam buku teks fantastis mereka . Dan saya katakan kerugian ini belum tentu benar lagi.

2
Beberapa pertanyaan . Apakah ia dengan jelas mengidentifikasi perubahan tren waktu dan melaporkan titik waktu di mana tren berubah? Apakah ia membedakan antara perubahan parameter dan perubahan varian kesalahan dan melaporkannya? Apakah ia mendeteksi dan melaporkan efek lead dan lag tertentu di sekitar prediktor yang ditentukan pengguna? Bisakah seseorang menentukan jumlah minimum nilai dalam suatu kelompok sebelum pergeseran level / tren waktu lokal diumumkan? Apakah itu membedakan antara kebutuhan untuk transformasi daya versus titik deterministik dalam waktu di mana varians kesalahan berubah? Model ARMAX berbicara dengan semua pertimbangan ini.
IrishStat

1
Untuk kelengkapan, kelemahan dalam beberapa keadaan adalah Anda harus menjelaskannya. Itu tergantung pada audiens Anda. Saya senang jika ada yang mau menganggap ini sebagai sesuatu yang, atau seharusnya, tidak relevan untuk memilih teknik.
Nick Cox

Jawaban:


25

Berikut adalah beberapa daftar kerugian awal yang dapat saya ekstrak dari komentar Anda. Kritik dan tambahan sangat kami sambut!

Secara keseluruhan - dibandingkan dengan ARIMA, model ruang-ruang memungkinkan Anda untuk memodelkan proses yang lebih kompleks, memiliki struktur yang dapat ditafsirkan dan dengan mudah menangani penyimpangan data; tetapi untuk ini Anda membayar dengan kompleksitas model yang semakin meningkat, kalibrasi yang lebih sulit, lebih sedikit pengetahuan masyarakat.

  1. ARIMA adalah aproksimator universal - Anda tidak peduli apa model sebenarnya di balik data Anda dan Anda menggunakan alat diagnostik dan pemasangan ARIMA universal untuk memperkirakan model ini. Ini seperti pemasangan kurva polinomial - Anda tidak peduli apa fungsi sebenarnya, Anda selalu dapat memperkirakannya dengan polinomial beberapa derajat.
  2. Model state-space secara alami mengharuskan Anda untuk menulis beberapa model yang masuk akal untuk proses Anda (yang bagus - Anda menggunakan pengetahuan sebelumnya tentang proses Anda untuk meningkatkan perkiraan). Tentu saja, jika Anda tidak memiliki gagasan tentang proses Anda, Anda selalu dapat menggunakan beberapa model ruang-negara universal - misalnya mewakili ARIMA dalam bentuk ruang-negara. Tapi kemudian ARIMA dalam bentuk aslinya memiliki formulasi yang lebih pelit - tanpa memperkenalkan negara tersembunyi yang tidak perlu.
  3. Karena ada begitu banyak formulasi model ruang-negara (jauh lebih kaya daripada kelas model ARIMA), perilaku semua model potensial ini tidak dipelajari dengan baik dan jika model yang Anda rumuskan rumit - sulit untuk mengatakan bagaimana ia akan berperilaku dalam keadaan yang berbeda. Tentu saja, jika model ruang-negara Anda sederhana atau terdiri dari komponen-komponen yang dapat ditafsirkan, tidak ada masalah seperti itu. Tetapi ARIMA selalu sama dengan ARIMA yang dipelajari dengan baik sehingga harus lebih mudah untuk mengantisipasi perilakunya bahkan jika Anda menggunakannya untuk memperkirakan beberapa proses yang kompleks.
  4. Karena state-space memungkinkan Anda memodelkan model kompleks / nonlinier secara langsung dan tepat, maka untuk model kompleks / nonlinier ini Anda mungkin memiliki masalah dengan stabilitas penyaringan / prediksi (EKF / UKF divergence, degradasi filter partikel). Anda mungkin juga memiliki masalah dengan mengkalibrasi parameter model rumit - ini adalah masalah optimisasi yang sulit secara komputasi. ARIMA sederhana, memiliki lebih sedikit parameter (1 sumber suara daripada 2 sumber suara, tidak ada variabel tersembunyi) sehingga kalibrasi lebih sederhana.
  5. Untuk ruang negara, ada lebih sedikit pengetahuan dan perangkat lunak komunitas dalam komunitas statistik daripada ARIMA.

1
Apakah Anda mengetahui adanya contoh nyata / aplikasi industri di mana filter Kalman berkinerja lebih baik daripada rata-rata bergerak sederhana atau perataan exp dalam meramalkan deret waktu asalkan tidak ada model dasar yang jelas (jadi singkirkan model yang muncul dari hukum fisika) ? Dalam kebanyakan makalah kinerjanya terlihat sangat mirip (dan makalah akademis memiliki bias kinerja positif untuk model-model baru, asli, dan kompleks). Dalam sebagian besar kasus tidak ada pengetahuan tentang model yang tepat linear sistem negara dan covariances, dll, diperlukan untuk menentukan Klaman filter ...
Mannaggia

Ini benar. Saya masih memiliki contoh dalam praktik saya. Ketika Anda memiliki beberapa model tujuan umum (seperti regresi linier) maka Anda dapat membuat parameternya menyatakan Kalman Filter dan memperkirakannya secara dinamis. Tentu saja, Anda juga dapat mereparasi model Anda pada setiap langkah waktu, tetapi ini jauh lebih mahal secara komputasi daripada pembaruan KF tunggal. Jika dalam kenyataannya parameter memang bervariasi dari waktu ke waktu atau jika model Anda tidak sama persis dengan proses yang sebenarnya - ini dapat membantu menyesuaikan model Anda dengan lebih baik dan meningkatkan kinerjanya.
Kochede

1
Saya tidak dapat menemukan referensi apa pun untuk ARIMA sebagai penaksir universal universal selain pos Anda. Bisakah Anda mengarahkan saya ke satu?
Skander H.

2
@Alex Ini mengikuti dari teorema dekomposisi Wold, misalnya lihat di sini phdeconomics.sssup.it/documents/Lesson11.pdf
Kochede

1
Dapatkah saya mengatakan model ruang negara memiliki bentuk yang lebih umum dan ARIMA hanya mencakup sebagian saja?
Vickyyy

3

Terima kasih @IrishStat untuk beberapa pertanyaan yang sangat bagus dalam komentar, jawaban untuk pertanyaan Anda terlalu panjang untuk dikirim sebagai komentar, jadi saya mempostingnya sebagai jawaban (sayangnya, bukan untuk pertanyaan asli dari topik).

Pertanyaannya adalah: " Apakah ia secara jelas mengidentifikasi perubahan tren waktu dan melaporkan titik waktu di mana tren berubah? Apakah ia membedakan antara perubahan parameter dan perubahan varians kesalahan dan melaporkan ini? Apakah ia mendeteksi dan melaporkan efek lead dan lag tertentu di sekitar pengguna prediktor yang ditentukan? Bisakah seseorang menentukan jumlah minimum nilai dalam suatu kelompok sebelum pergeseran level / tren waktu setempat diumumkan? Apakah ia membedakan antara kebutuhan akan transformasi daya versus titik deterministik pada waktu di mana varians kesalahan berubah? "

  1. Identifikasi perubahan tren - ya, yang paling alami, Anda dapat membuat tren-lereng salah satu variabel-negara dan KF akan terus memperkirakan kemiringan saat ini. Anda kemudian dapat memutuskan perubahan lereng apa yang cukup besar untuk Anda. Atau, jika kemiringan tidak bervariasi dalam model ruang-negara Anda, Anda dapat menguji residu selama pemfilteran dengan cara standar untuk melihat ketika ada beberapa kerusakan dari model Anda.
  2. Bedakan antara perubahan parameter dan perubahan varians kesalahan - ya, varians dapat menjadi salah satu parameter (status), lalu parameter mana yang paling mungkin berubah tergantung pada kemungkinan model Anda dan seberapa khususnya data telah berubah.
  3. Deteksi hubungan timbal / jeda - tidak yakin tentang hal ini, Anda tentu dapat memasukkan vars lagged ke dalam model state-space; untuk pemilihan kelambatan, Anda dapat menguji residu model dengan kelambatan berbeda yang disertakan atau, dalam kasus sederhana, cukup gunakan korelasi silang sebelum merumuskan model.
  4. Tentukan jumlah ambang pengamatan untuk menentukan perubahan tren - ya, seperti pada 1) karena pemfilteran dilakukan secara rekursif, Anda tidak bisa hanya ambang perubahan kemiringan yang cukup besar untuk Anda, tetapi juga # pengamatan untuk kepercayaan diri. Tetapi lebih baik - KF menghasilkan tidak hanya estimasi kemiringan, tetapi juga pita kepercayaan untuk perkiraan ini, sehingga Anda dapat memutuskan bahwa kemiringan berubah secara signifikan ketika kepercayaannya melewati beberapa ambang batas.
  5. Bedakan antara kebutuhan untuk transformasi daya dan kebutuhan untuk varian yang lebih besar - tidak yakin saya mengerti benar, tapi saya pikir Anda dapat menguji residu selama penyaringan untuk melihat apakah mereka masih normal dengan varian yang lebih besar atau mereka memiliki beberapa kecenderungan sehingga Anda perlu mengubah model Anda. Lebih baik - Anda dapat menjadikannya model switching biner dari model Anda, maka KF akan memperkirakannya secara otomatis berdasarkan pada kemungkinan. Dalam hal ini model akan non-linier sehingga Anda perlu UKF untuk melakukan penyaringan.

1

Filter Kalman adalah penaksir kuadrat linier yang optimal ketika dinamika keadaan dan kesalahan pengukuran mengikuti apa yang disebut asumsi Gaussian linear ( http://wp.me/p491t5-PS ). Jadi, selama Anda tahu dinamika dan model pengukuran Anda dan mereka mengikuti asumsi Gaussian linier, tidak ada penduga yang lebih baik di kelas penduga kuadrat linier. Namun, alasan paling umum untuk aplikasi Kalman Filter "gagal" adalah:

  1. Pengetahuan yang tidak tepat / salah tentang dinamika status dan model pengukuran.

  2. Inisialisasi filter yang tidak akurat (memberikan perkiraan kondisi awal dan kovarian yang tidak konsisten dengan kondisi sistem yang sebenarnya). Ini mudah diatasi dengan menggunakan prosedur inisialisasi Weighted Least Squares (WLS).

  3. Memasukkan pengukuran yang merupakan "pencilan" statistik sehubungan dengan model dinamika sistem. Hal ini dapat menyebabkan Keuntungan Kalman memiliki elemen negatif, yang dapat menyebabkan matriks kovarians semi-pasti non-positif setelah pembaruan. Ini dapat dihindari dengan menggunakan algoritma "gating", seperti ellipsoidal gating, untuk memvalidasi pengukuran sebelum memperbarui Filter Kalman dengan pengukuran itu.

Ini adalah beberapa kesalahan / masalah paling umum yang saya lihat bekerja dengan Filter Kalman. Jika tidak, jika asumsi model Anda valid, Filter Kalman adalah penaksir yang optimal.


1

Anda dapat merujuk ke buku hebat Bayesian model peramalan dan dinamis (Harrison dan Barat, 1997). Para penulis menunjukkan bahwa hampir semua model deret waktu tradisional adalah kasus tertentu dari model dinamis umum. Mereka juga menekankan kelebihannya. Mungkin salah satu keuntungan utama adalah kemudahan yang Anda dapat mengintegrasikan banyak model ruang negara dengan hanya menambah vektor negara. Anda dapat, misalnya, mengintegrasikan regressor, faktor musiman, dan komponen autoregresif dalam satu model.


Hai, dapatkah Anda menguraikan lebih lanjut tentang "Anda dapat, misalnya, mengintegrasikan regressor, faktor musiman, dan komponen autoregresif dalam satu model."? Koreksi saya jika saya salah, apakah itu berarti untuk ARIMA Anda perlu membuat time series stasioner tetapi untuk model ruang angkasa Anda hanya perlu mengubah jumlah variabel keadaan?
Vickyyy

@Vickyyy Tidak seperti ARIMA, model ruang angkasa tidak menganggap stasioneritas. Anda bisa menambahkan banyak komponen dan merepresentasikannya dalam satu vektor keadaan.
Anselmo

1

Saya akan menambahkan bahwa jika Anda secara langsung menggunakan fungsi State Space, Anda mungkin harus memahami beberapa matriks yang membentuk model, dan bagaimana mereka berinteraksi dan bekerja. Ini jauh lebih seperti mendefinisikan program daripada mendefinisikan model ARIMA. Jika Anda bekerja dengan model State Space dinamis, itu akan menjadi lebih rumit.

Jika Anda menggunakan paket perangkat lunak yang memiliki fungsi State Space yang benar-benar bagus, Anda mungkin dapat menghindari beberapa hal ini, tetapi sebagian besar fungsi tersebut dalam paket R mengharuskan Anda untuk beralih ke detail di beberapa titik.

Menurut pendapat saya, ini sangat mirip dengan statistik Bayesian secara umum, mesin yang membutuhkan lebih banyak pemahaman, perawatan, dan pemberian makan untuk digunakan daripada fungsi yang lebih sering.

Dalam kedua kasus tersebut, ada baiknya dilakukan perincian tambahan / pengetahuan, tetapi bisa menjadi penghalang untuk adopsi.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.