Deseasonalisasi data hitungan


12

Saya menggunakan stl () di R untuk menguraikan data hitungan menjadi komponen tren, musiman & tidak teratur. Nilai tren yang dihasilkan bukan bilangan bulat lagi. Saya punya pertanyaan berikut:

  1. Apakah stl () cara yang tepat untuk menasionalisasi data hitungan?
  2. Karena tren yang dihasilkan tidak lagi dinilai interger, dapatkah saya menggunakan lm () untuk memodelkan komponen tren?

Jawaban:


8

Tidak ada masalah inheren dengan menggunakan stl () untuk menentukan jumlah data. Namun satu masalah yang harus diperhatikan adalah bahwa jumlah data umumnya memiliki varians yang meningkat dengan meningkatnya rata-rata. Ini sering terlihat dalam elemen musiman dan acak dari dekomposisi. Menggunakan stl () pada data mentah tidak akan memperhitungkan ini, dan karenanya mungkin yang terbaik adalah terlebih dahulu mengambil logaritma (edit - atau root kuadrat) dari data Anda.

Tidak masalah bahwa nilai tren tidak bilangan bulat lagi. Mereka dapat dianggap dengan cara yang mirip dengan parameter dalam distribusi Poisson. Meskipun variabel terdistribusi Poisson harus berupa bilangan bulat, artinya tidak perlu.

Namun, ini tidak berarti Anda dapat menggunakan lm () untuk memodelkan komponen tren. Ada banyak jebakan dalam tren pemodelan dalam deret waktu, karena korelasi palsu akan sangat sulit untuk dihindari. Lebih umum orang-orang pertama-tama menentukan urutan seri dan kemudian memodelkan bagian residual.


1
Bagaimana Anda menentukan berapa banyak tren yang perlu diakomodasi dan panjang setiap tren? Apakah Anda membedakan antara perubahan level dan tren dan secara umum bagaimana Anda membenci kehadiran outlier / inliers?
IrishStat

@IrishStat - ya, itu semua adalah poin yang bagus dan saya tidak mencoba untuk mengatasi set lengkap masalah, hanya menarik perhatian pada masalah menggunakan komponen tren dari output R's stl () sebagai variabel respon dalam regresi . stl () menggunakan regresi berbobot lokal dalam dekomposisi yang umumnya memberikan hasil yang masuk akal ketika datang ke tren perubahan arah, dll, meskipun tentu saja memiliki keterbatasan dibandingkan dengan metode berbasis model terutama untuk peramalan.
Peter Ellis
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.