Misalkan saya memiliki lebih dari 20.000 seri waktu bulanan mulai dari Jan'05 hingga Dec'11. Masing-masing mewakili data penjualan global untuk produk yang berbeda. Bagaimana jika, alih-alih menghitung perkiraan untuk masing-masing, saya hanya ingin fokus pada sejumlah kecil produk yang "benar-benar penting"?
Saya bisa memberi peringkat produk-produk tersebut dengan total pendapatan tahunan dan memangkas daftar menggunakan Pareto klasik. Masih nampak bagi saya bahwa, meskipun mereka tidak berkontribusi banyak pada bottom line, beberapa produk sangat mudah untuk diramalkan sehingga meninggalkan mereka akan menjadi penilaian yang buruk. Sebuah produk yang dijual senilai $ 50 setiap bulan selama 10 tahun terakhir mungkin tidak terdengar banyak, tetapi membutuhkan sedikit usaha untuk menghasilkan prediksi tentang penjualan di masa depan sehingga saya mungkin juga melakukannya.
Jadi katakanlah saya membagi produk saya dalam empat kategori: pendapatan tinggi / mudah diperkirakan - pendapatan rendah / mudah diperkirakan - pendapatan tinggi / sulit diperkirakan - pendapatan rendah / sulit diperkirakan.
Saya pikir akan masuk akal untuk meninggalkan hanya seri waktu milik kelompok keempat. Tetapi bagaimana tepatnya saya bisa mengevaluasi "perkiraan"?
Koefisien variasi sepertinya merupakan titik awal yang baik (saya juga ingat pernah melihat beberapa makalah tentang itu beberapa waktu yang lalu). Tetapi bagaimana jika seri waktu saya menunjukkan perubahan musiman / level / efek kalender / tren yang kuat?
Saya akan membayangkan saya harus mendasarkan evaluasi saya hanya pada variabilitas komponen acak dan bukan salah satu dari data "mentah". Atau apakah saya melewatkan sesuatu?
Adakah yang pernah menemukan masalah serupa sebelumnya? Bagaimana kalian akan melakukannya?
Seperti biasa, bantuan apa pun sangat dihargai!