Mengembangkan model deret waktu yang sesuai untuk memprediksi penjualan berdasarkan catatan bulan lalu


12

Saya telah mengoperasikan bisnis online selama dua tahun berturut-turut sekarang, jadi saya memiliki data penjualan bulanan selama sekitar dua tahun. Bisnis saya untuk setiap bulan tentu saja dipengaruhi oleh ayunan musiman (berkinerja lebih baik saat Natal, dll), dan mungkin beberapa faktor lain yang tidak saya sadari.

Untuk memprediksi penjualan di masa depan yang lebih baik, dan untuk mengukur efektivitas kampanye penjualan saya, atau dampak dari pesaing baru, saya ingin dapat mengembangkan model deret waktu yang sesuai untuk mengekstrapolasi data penjualan saya saat ini ke masa depan. Ini agar ketika saya membandingkan hasil prediksi saya dengan hasil aktual, saya dapat secara kuantitatif menguji efektivitas kampanye penjualan saya, atau dampak dari pesaing.

Pertanyaan saya adalah, mengingat saya memiliki data penjualan selama 2 tahun, adakah di sana saya dapat merumuskan model deret waktu yang dapat diprediksi untuk hal ini?

Catatan: Saya lebih tertarik pada konsep latar belakang dan teori, daripada alat kotak hitam. Berbicara tentang alat, saya memiliki mathatica, matlab, R, Excel, Google Spreadsheet .... sebut saja.


Anda menggunakan perangkat lunak apa?
Dimitriy V. Masterov

1
@ DimitriyV.Masterov, saya punya Matlab / R / Excel / Mathematica ... sebut saja. Sebenarnya saya lebih tertarik pada konsep daripada menulis kode sebenarnya sendiri
Graviton

Jawaban:


14

Ya, ada cara untuk melakukan ini. Orang - orang mencari nafkah dengan melakukan hal-hal seperti ini ;-)

Anda mencari prakiraan kausal . Lihatlah buku teks online gratis ini tentang perkiraan untuk belajar tentang metodologi perkiraan.

Anda memiliki dua masalah utama yang perlu Anda tangani: musiman (atau lebih umum, struktur deret waktu, mungkin dengan autoregresi) di satu sisi, dan efek kausal seperti promosi di sisi lain. Bab 8 dalam buku teks di atas membahas hal-hal deret waktu dalam konteks ARIMA, sedangkan Bab 5 membahas efek sebab-akibat.

Untungnya, dimungkinkan untuk mengatasi kedua masalah dengan menghitung model ARIMAX (X singkatan dari "efek eksternal", yaitu ARIMA dengan efek eksternal), atau regresi dengan kesalahan ARIMA. Lihat posting blog Rob Hyndman di "The ARIMAX model muddle" untuk perbedaannya. The auto.arima()fungsi dalam forecastpaket R akan cocok regresi dengan kesalahan ARIMA. Mari kita telusuri contoh, di mana saya mengambil dataset standar dengan tren dan musim yang kuat dan menambahkan "promosi".

library(forecast)
AirPassengers # a built-in dataset
#      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
# 1949 112 118 132 129 121 135 148 148 136 119 104 118
# 1950 115 126 141 135 125 149 170 170 158 133 114 140
# 1951 145 150 178 163 172 178 199 199 184 162 146 166
# 1952 171 180 193 181 183 218 230 242 209 191 172 194
# 1953 196 196 236 235 229 243 264 272 237 211 180 201
# 1954 204 188 235 227 234 264 302 293 259 229 203 229
# 1955 242 233 267 269 270 315 364 347 312 274 237 278
# 1956 284 277 317 313 318 374 413 405 355 306 271 306
# 1957 315 301 356 348 355 422 465 467 404 347 305 336
# 1958 340 318 362 348 363 435 491 505 404 359 310 337
# 1959 360 342 406 396 420 472 548 559 463 407 362 405
# 1960 417 391 419 461 472 535 622 606 508 461 390 432

set.seed(1) # for reproducibility
promos <- rep(0,length(AirPassengers))
promos[sample(seq_along(AirPassengers),10)] <- 1
promos.future <- c(0,1,0,0,1,0,0,1,0,0,1,0)
AP.with.promos <- AirPassengers
AP.with.promos[promos==1] <- AP.with.promos[promos==1]+120

model <- auto.arima(AP.with.promos,xreg=promos)
summary(model) # examine the model - you'll see the estimated promo coefficient
# Series: AP.with.promos 
# ARIMA(0,1,1)(0,1,0)[12]                    

# Coefficients:
#           ma1    promos
#       -0.3099  122.2599
# s.e.   0.0947    2.2999

# sigma^2 estimated as 151.2:  log likelihood=-457.4
# AIC=920.79   AICc=920.98   BIC=929.42

# Training set error measures:
#                     ME     RMSE     MAE        MPE     MAPE      MASE         ACF1
# Training set 0.2682805 11.12974 8.24397 0.06139784 2.867274 0.1860814 0.0008326436

fcast <- forecast(model,xreg=promos.future,h=length(promos.future))
fcast
#          Point Forecast    Lo 80    Hi 80    Lo 95    Hi 95
# Jan 1961       447.1516 431.3951 462.9081 423.0542 471.2490
# Feb 1961       543.4115 524.2670 562.5559 514.1326 572.6904
# Mar 1961       449.1516 427.1345 471.1687 415.4793 482.8239
# Apr 1961       491.1516 466.5956 515.7076 453.5964 528.7068
# May 1961       624.4115 597.5556 651.2674 583.3389 665.4841
# Jun 1961       565.1516 536.1777 594.1255 520.8399 609.4633
# Jul 1961       652.1516 621.2044 683.0988 604.8220 699.4812
# Aug 1961       758.4115 725.6095 791.2135 708.2452 808.5778
# Sep 1961       538.1516 503.5942 572.7090 485.3006 591.0026
# Oct 1961       491.1516 454.9237 527.3795 435.7459 546.5573
# Nov 1961       542.4115 504.5869 580.2361 484.5637 600.2593
# Dec 1961       462.1516 422.7950 501.5082 401.9608 522.3424
promos.ts <- ts(c(AP.with.promos,fcast$mean),
                  start=start(AirPassengers),frequency=frequency(AirPassengers))
promos.ts[c(promos,promos.future)==0] <- NA

plot(fcast)
points(promos.ts,pch=19,col="red")

ARIMAX

Titik merah adalah promosi. Secara default, Anda akan mendapatkan interval prediksi yang diplot dengan warna abu-abu. Anda dapat memasukkan banyak regressor ke dalam model Anda melalui xregparameter, yang harus Anda lakukan jika Anda memiliki berbagai jenis promosi dengan efek yang berbeda. Bereksperimen sedikit.

Saya akan merekomendasikan melihat lebih banyak data berbutir halus daripada bulanan jika Anda memilikinya, misalnya mingguan. Terutama tentu saja jika promosi Anda tidak berjalan selama berbulan-bulan penuh. Anda dapat melakukan ini secara terpisah berdasarkan produk, sekali lagi terutama jika Anda mempromosikan produk tertentu, atau pada seluruh kategori.

Alternatifnya adalah, mengingat bahwa Anda lebih tertarik pada konsep daripada kode, untuk melihat Smoothing Eksponensial dan mengubahnya sesuai dengan kebutuhan Anda, dengan menambahkan komponen promosi ke level tiga level, musim dan komponen tren. Anda dapat melakukan lebih banyak hal dengan Eksponensial Smoothing daripada mencoba memperkirakan kemungkinan maksimum model ARIMAX, tetapi Smoothing dapat berubah menjadi sedikit mimpi buruk pembukuan jika Anda memiliki beberapa tipe promosi.


1
Model ARIMA dengan kovariat dibahas dalam Bagian 9 buku ini: www.otexts.org/fpp/9/1
Rob Hyndman

Terima kasih, Rob. Saya benar-benar harus membaca buku lebih sering ...
Stephan Kolassa

Terima kasih @StephanKolassa! pertanyaan sampingan, dapatkah saya mendapatkan buku yang Anda sebutkan di pos di atas, dalam format mobi atau epub?
Graviton

1
@ Graviton: pertanyaan bagus. Terbaik untuk bertanya kepada penulis. Salah satunya adalah Rob Hyndman, yang berkomentar di atas.
Stephan Kolassa

1
@Graviton. Sedang mengerjakannya. Lihat robjhyndman.com/hyndsight/fpp-amazon
Rob Hyndman

4

pertama, Anda tidak memiliki banyak data untuk dimainkan, hanya 24 pengamatan. Dalam kasus Anda, ini berarti bahwa Anda hampir tidak memiliki beberapa parameter untuk memperkirakan dengan andal. cara paling sistematis dalam peramalan adalah menghasilkan proses pembuatan data (DGP). Anda membuat asumsi tentang apa proses sebenarnya untuk penjualan Anda, lalu mencoba memperkirakan parameternya.

xt=ϕxt1+c

(1L)(1L12)xt=cxt=c+ϕ1xt-1+ϕ12xt-12-ϕ1ϕ12xr-13. ini menambahkan satu parameter lagi untuk diperkirakan, jadi Anda turun ke 6 pengamatan per parameter - peregangan nyata.

di Matlab model ini ditentukan sebagai arima('ARLags',1,'SARLags',12)

ini dengan asumsi bahwa penjualan Anda stabil, yaitu umumnya tidak tumbuh.

jika Anda berpikir bahwa penjualan Anda meningkat, maka Anda memiliki dua opsi: jalan acak (RW) dan tren waktu.

di Matlab RW ditentukan dengan arima('D',1,'SARLags',12)

jelas, ini hanya contoh DGP yang berbeda. apa pun yang Anda lakukan, perlu diingat jumlah parameter yang akan diestimasi. dengan 24 pengamatan, model Anda harus sangat sederhana, paling banyak 4 parameter (termasuk varian).


0

Inilah yang harus Anda lakukan Buat dua grafik:

  • Penjualan vs. Waktu selama 24 bulan penuh
  • Penjualan vs. Waktu dengan tahun kedua diplot di atas tahun pertama

Lihat mereka. Beri catatan tanggal pada setiap promosi khusus, atau aktivitas kompetitif yang diketahui. "Desember" biasanya cukup jelas, tetapi tambahkan catatan jika membantu membatalkannya.

Teruskan dan muat model deret waktu - model apa pun (ada ratusan). Model ini dapat memberi Anda perkiraan yang sedikit lebih baik untuk periode berikutnya (t +1) daripada penilaian Anda. Setidaknya, itu akan menantang penilaian Anda. Di luar periode berikutnya (t + n, n> 1), model deret waktu apa pun adalah omong kosong. † Jadi, lupakan tentang evaluasi kuantitatif efektivitas kampanye penjualan atau efek dari pesaing. Jika Anda membandingkan penjualan aktual dengan prediksi, Anda akan menemukan bahwa prediksi tersebut omong kosong. Memprediksi masa depan itu sulit, dan tidak ada metode yang mengubah fakta dasar itu.

Anda akan menemukan dua grafik Anda lebih bermanfaat. Pelajarilah itu sebentar, lalu habiskan sisa waktu Anda dengan ide-ide tentang cara meningkatkan penjualan - ini akan menjadi penggunaan waktu Anda yang jauh lebih menguntungkan yang mencoba menyesuaikan model deret waktu.

† Anda memiliki harapan yang lebih besar jika Anda dapat membuat model prediksi berdasarkan indikator utama - yaitu, penjualan perumahan untuk bulan sebelumnya mungkin berguna untuk memprediksi penjualan nuansa jendela pada bulan berjalan.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.