Untuk memutuskan ukuran perkiraan kesalahan titik mana yang akan digunakan, kita perlu mengambil langkah mundur. Perhatikan bahwa kita tidak tahu hasil di masa depan dengan sempurna, juga tidak akan pernah. Jadi hasil masa depan mengikuti distribusi probabilitas . Beberapa metode peramalan secara eksplisit menghasilkan distribusi penuh, dan beberapa tidak - tetapi selalu ada, jika hanya secara implisit.
Sekarang, kami ingin memiliki ukuran kesalahan yang baik untuk perkiraan titik . Seperti titik meramalkan Ft adalah upaya kami untuk meringkas apa yang kita ketahui tentang distribusi masa depan (yaitu, distribusi prediksi) pada waktu t menggunakan satu nomor, yang disebut fungsional dari kepadatan masa depan. Ukuran kesalahan kemudian adalah cara untuk menilai kualitas ringkasan angka tunggal ini.
Jadi, Anda harus memilih ukuran kesalahan yang memberi hadiah "baik" ringkasan nomor satu (tidak diketahui, mungkin diperkirakan, tetapi mungkin hanya tersirat) kepadatan masa depan.
Tantangannya adalah bahwa ukuran kesalahan yang berbeda diminimalkan oleh fungsi yang berbeda. MSE yang diharapkan diminimalkan oleh nilai yang diharapkan dari distribusi di masa depan. MAD yang diharapkan diminimalkan dengan median distribusi masa depan. Jadi, jika Anda mengkalibrasi prakiraan Anda untuk meminimalkan MAE, prakiraan titik Anda akan menjadi median masa depan, bukan nilai yang diharapkan di masa depan, dan prakiraan Anda akan menjadi bias jika distribusi masa depan Anda tidak simetris.
Ini paling relevan untuk data jumlah, yang biasanya miring. Dalam kasus ekstrem (misalnya, Poisson mendistribusikan penjualan dengan rata-rata di bawah log2≈0.69 ), MAE Anda akan menjadi terendah untuk perkiraan nol datar. Lihat di sini atau di sini atau di sini untuk detailnya.
Saya memberikan beberapa informasi dan ilustrasi dalam Apa saja kekurangan Kesalahan Persentase Absolut Rata-Rata (MAPE)? Utas itu mempertimbangkan mape , tetapi juga tindakan kesalahan lainnya, dan berisi tautan ke utas terkait lainnya.
Pada akhirnya, ukuran kesalahan yang digunakan benar-benar tergantung pada Biaya Kesalahan Prakiraan, yaitu jenis kesalahan apa yang paling menyakitkan. Tanpa melihat implikasi aktual kesalahan ramalan, setiap diskusi tentang "kriteria yang lebih baik" pada dasarnya tidak ada artinya.
Ukuran akurasi ramalan adalah topik besar di komunitas ramalan beberapa tahun yang lalu, dan mereka masih muncul sekarang dan kemudian. Satu artikel yang sangat bagus untuk dilihat adalah Hyndman & Koehler "Pandangan lain tentang ukuran akurasi prakiraan" (2006).
Akhirnya, salah satu alternatif adalah menghitung kepadatan prediksi penuh dan menilai ini menggunakan aturan penilaian yang tepat .