Bagaimana ACF & PACF mengidentifikasi urutan persyaratan MA dan AR?


12

Sudah lebih dari 2 tahun saya mengerjakan seri waktu yang berbeda. Saya telah membaca banyak artikel bahwa ACF digunakan untuk mengidentifikasi urutan istilah MA, dan PACF untuk AR. Ada aturan praktis bahwa untuk MA, jeda di mana ACF mati tiba-tiba adalah urutan MA dan juga untuk PACF dan AR.

Ini adalah salah satu artikel yang saya ikuti dari PennState Eberly College of Science.

Pertanyaan saya adalah mengapa demikian? Bagi saya bahkan ACF dapat memberikan istilah AR. Saya perlu penjelasan tentang aturan praktis yang disebutkan di atas. Saya tidak dapat memahami aturan praktis secara intuitif / matematis mengapa itu -

Identifikasi model AR seringkali paling baik dilakukan dengan PACF.
Identifikasi model MA seringkali paling baik dilakukan dengan ACF daripada PACF

Harap dicatat: - Saya tidak perlu bagaimana tetapi "MENGAPA". :)

Jawaban:


9

Kutipan berasal dari tautan di OP:

Identifikasi model AR seringkali paling baik dilakukan dengan PACF.

Untuk model AR, PACF teoretis “mati” melewati urutan model. Frasa "mati" berarti bahwa dalam teori autokorelasi parsial sama dengan 0 di luar titik itu. Dengan kata lain, jumlah autokorelasi parsial non-nol memberikan urutan model AR. Yang kami maksud dengan "urutan model" adalah jeda x paling ekstrem yang digunakan sebagai prediktor.

... a rangka autoregresi, ditulis sebagai AR (k), adalah regresi linier berganda di mana nilai seri kapan saja t adalah fungsi (linear) dari nilai pada waktuktht1,t2,,tk:

yt=β0+β1yt1+β2yt2++β2ytk+ϵt.

Persamaan ini terlihat seperti model regresi, seperti yang ditunjukkan pada halaman terkait ... Jadi apa intuisi yang mungkin dari apa yang kita lakukan ...

Dalam bisikan Cina atau permainan telepon seperti diilustrasikan di sini

masukkan deskripsi gambar di sini

pesan terdistorsi karena dibisikkan dari orang ke orang, dan semua jejak kemiripan (kata-kata yang jujur, jika Anda mau) hilang setelah peserta merah (dengan pengecualian artikel 'a'). PACF akan memberi tahu kita bahwa koefisien untuk peserta biru dan kuning tidak memberikan kontribusi begitu efek peserta coklat dan merah dihitung (peserta hijau di akhir garis tidak mengubah pesan).

Tidak sulit untuk mendekati hasil aktual dari fungsi R dengan benar-benar mendapatkan regresi OLS berturut-turut melalui asal dari urutan lag yang lebih jauh, dan mengumpulkan koefisien ke dalam vektor. Secara skematis,

masukkan deskripsi gambar di sini

proses yang sangat mirip dengan permainan telepon - ini akan menjadi titik, ketika tidak akan ada variabilitas dalam sinyal dari seri waktu awal yang sebenarnya ditemukan dalam potongan yang semakin jauh dari dirinya sendiri.


Identifikasi model MA seringkali paling baik dilakukan dengan ACF daripada PACF .

Untuk model MA, PACF teoretis tidak mematikan, melainkan mengecil ke 0 dalam beberapa cara. Pola yang lebih jelas untuk model MA ada di ACF. ACF akan memiliki autokorelasi bukan nol hanya pada kelambatan yang terlibat dalam model.

Istilah moving average dalam model deret waktu adalah kesalahan masa lalu (dikalikan dengan koefisien).

Theqth -model bergerak rata-rata, dilambangkan oleh MA (q) adalah

xt=μ+wt+θ1wt1+θ2wt2++θqwtq

denganwtiidN(0,σw2).

Di sini, bukan kemiripan pesan di seluruh titik waktu yang dicari mundur dalam waktu selangkah demi selangkah, melainkan kontribusi dari kebisingan, yang saya bayangkan sebagai penyimpangan besar yang sering terjadi yang dapat dituntun oleh jalan acak sepanjang garis waktu:

masukkan deskripsi gambar di sini

Di sini ada beberapa, urutan diimbangi secara progresif yang berkorelasi, membuang setiap kontribusi dari langkah-langkah perantara. Ini akan menjadi grafik dari operasi yang terlibat:masukkan deskripsi gambar di sini

Dalam hal ini, "CV itu keren!" tidak sepenuhnya berbeda dari "Naomi memiliki kolam". Dari sudut pandang kebisingan, sajak masih ada sampai ke awal permainan.


Ini adalah jawaban yang sangat keren, pekerjaan yang baik (+1)
Firebug

Rob Hyndman menyarankan strategi ini untuk ARIMA, yang menggunakan pacf dan acf untuk menentukan pesanan. Apakah kita perlu tahu sebelumnya seri apa yang harus kita gunakan strategi yang dijelaskan dalam jawaban Anda? Terima kasih!
stucash

Silakan ambil jawaban saya sebagai latihan didaktik. Saya bukan ahli dalam topik ini.
Antoni Parellada

4

Robert Nau dari Duke's Fuqua School of Business memberikan penjelasan terperinci dan agak intuitif tentang bagaimana plot ACF dan PACF dapat digunakan untuk memilih pesanan AR dan MA di sini dan di sini . Saya memberikan ringkasan singkat dari argumennya di bawah ini.

Penjelasan sederhana tentang mengapa PACF mengidentifikasi urutan AR

kkk

Penjelasan lebih lengkap yang juga membahas penggunaan ACF untuk mengidentifikasi pesanan MA

Rangkaian waktu dapat memiliki tanda tangan AR atau MA:

  • Tanda tangan AR sesuai dengan plot PACF yang menampilkan cut-off yang tajam dan ACF yang membusuk lebih lambat;
  • Tanda tangan MA sesuai dengan plot ACF yang menampilkan cut-off tajam dan plot PACF yang meluruh lebih lambat.

Tanda tangan AR sering dikaitkan dengan autokorelasi positif pada lag 1, menunjukkan bahwa seri ini sedikit "kurang terdiferensiasi" (ini berarti bahwa diperlukan pembedaan lebih lanjut untuk sepenuhnya menghilangkan autokorelasi). Karena istilah AR mencapai perbedaan parsial (lihat di bawah), ini dapat diperbaiki dengan menambahkan istilah AR ke model (karenanya nama tanda tangan ini). Oleh karena itu plot PACF dengan cut-off yang tajam (disertai dengan plot ACF yang lambat membusuk dengan lag pertama yang positif) dapat menunjukkan urutan istilah AR. Nau menempatkannya sebagai berikut:

Jika PACF dari seri berbeda menampilkan cutoff tajam dan / atau autokorelasi lag-1 positif - yaitu, jika seri tampak sedikit "kurang terdiferensiasi" - maka pertimbangkan untuk menambahkan istilah AR ke model. Kelambatan di mana PACF terputus adalah jumlah istilah AR yang ditunjukkan.

Tanda tangan MA, di sisi lain, umumnya dikaitkan dengan kelambatan pertama negatif, menunjukkan bahwa seri "terlalu banyak perbedaan" (yaitu perlu untuk membatalkan sebagian perbedaan untuk mendapatkan seri stasioner). Karena ketentuan MA dapat membatalkan urutan perbedaan (lihat di bawah), plot ACF dari seri dengan tanda tangan MA menunjukkan urutan MA yang diperlukan:

Jika ACF dari seri yang dibeda-bedakan menampilkan cutoff yang tajam dan / atau autokorelasi lag-1 negatif - yaitu, jika seri tersebut tampak sedikit "berlebih-lebihan" - maka pertimbangkan untuk menambahkan istilah MA ke model. Jeda di mana ACF terputus adalah jumlah yang tertera dari ketentuan MA.

Mengapa istilah AR mencapai perbedaan parsial dan ketentuan MA membatalkan sebagian perbedaan sebelumnya

Ambil model ARIMA dasar (1,1,1), disajikan tanpa konstan untuk kesederhanaan:

yt=YtYt1

yt=ϕyt1+etθet1

B

yt=(1B)Yt

yt=ϕByt+etθBet

yang selanjutnya dapat disederhanakan untuk memberikan:

(1ϕB)yt=(1θB)et

atau yang setara:

(1ϕB)(1B)Yt=(1θB)et

(1ϕB)ϕ(0,1)B(1θB)(1B)


2

Pada level yang lebih tinggi, berikut adalah cara memahaminya. (Jika Anda membutuhkan pendekatan yang lebih matematis, saya dengan senang hati dapat pergi setelah beberapa catatan saya tentang analisis deret waktu)

ACF dan PACF adalah konstruksi statistik teoritis seperti nilai atau varian yang diharapkan, tetapi pada domain yang berbeda. Cara yang sama ketika nilai yang diharapkan muncul ketika mempelajari variabel acak, ACF dan PACF muncul ketika mempelajari deret waktu.

Ketika mempelajari variabel acak, ada pertanyaan tentang bagaimana memperkirakan parameter mereka, yaitu di mana metode momen, MLE dan prosedur dan konstruksi lainnya masuk, serta memeriksa perkiraan, kesalahan standar mereka, dll.

Memeriksa perkiraan ACF dan PACF berasal dari ide yang sama, mengestimasi parameter dari proses deret waktu acak. Dapatkan idenya?

Jika Anda pikir Anda membutuhkan jawaban yang cenderung lebih matematis, tolong beri tahu saya, dan saya akan mencoba dan melihat apakah saya bisa membuat sesuatu pada akhir hari.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.