Prakiraan cuaca
Anda benar bahwa ini adalah masalah perkiraan. Ada beberapa artikel tentang perkiraan di jurnal Foresight berorientasi praktisi IIF . (Pengungkapan penuh: Saya adalah Associate Editor.)
Masalahnya adalah perkiraan sudah sulit untuk dinilai dalam kasus "sederhana".
Beberapa contoh
Misalkan Anda memiliki deret waktu seperti ini tetapi tidak bisa berbahasa Jerman:
Bagaimana Anda memodelkan puncak besar pada bulan April, dan bagaimana Anda akan memasukkan informasi ini dalam perkiraan apa pun?
Kecuali Anda tahu bahwa rangkaian waktu ini adalah penjualan telur dalam rantai supermarket Swiss, yang memuncak tepat sebelum kalender barat Paskah , Anda tidak akan memiliki kesempatan. Plus, dengan Paskah bergerak sekitar kalender sebanyak enam minggu, setiap ramalan yang tidak termasuk tanggal spesifik Paskah (dengan mengasumsikan, katakanlah, ini hanya puncak musiman yang akan terulang dalam minggu tertentu tahun depan) mungkin akan sangat tidak menyenangkan.
Demikian pula, anggap Anda memiliki garis biru di bawah ini dan ingin memodelkan apa pun yang terjadi pada 2010-02-28 begitu berbeda dari pola "normal" pada 2010-02-27:
Sekali lagi, tanpa mengetahui apa yang terjadi ketika seluruh kota yang penuh dengan orang Kanada menonton pertandingan final hoki es Olimpiade di TV, Anda tidak memiliki kesempatan apa pun untuk memahami apa yang terjadi di sini, dan Anda tidak akan dapat memprediksi kapan hal seperti ini akan terulang kembali.
Akhirnya, lihat ini:
Ini adalah rangkaian waktu penjualan harian di toko kas dan barang bawaan . (Di sebelah kanan, Anda memiliki tabel sederhana: 282 hari memiliki nol penjualan, 42 hari melihat penjualan 1 ... dan satu hari melihat penjualan 500.) Saya tidak tahu barang apa itu.
Sampai hari ini, saya tidak tahu apa yang terjadi pada hari itu dengan penjualan 500. Perkiraan terbaik saya adalah bahwa beberapa pelanggan memesan lebih dahulu sejumlah besar produk apa pun ini dan mengumpulkannya. Sekarang, tanpa mengetahui hal ini, ramalan untuk hari tertentu ini akan jauh. Sebaliknya, anggap ini terjadi tepat sebelum Paskah, dan kami memiliki algoritme bodoh-pintar yang percaya ini bisa menjadi efek Paskah (mungkin ini telur?) Dan dengan senang hati memperkirakan 500 unit untuk Paskah berikutnya. Ya ampun, bisakah itu salah.
Ringkasan
Dalam semua kasus, kami melihat bagaimana perkiraan hanya dapat dipahami dengan baik setelah kami memiliki pemahaman yang cukup mendalam tentang faktor-faktor yang mungkin memengaruhi data kami. Masalahnya adalah bahwa kecuali kita mengetahui faktor-faktor ini, kita tidak tahu bahwa kita mungkin tidak mengetahuinya. Sesuai Donald Rumsfeld :
[T] di sini dikenal dikenal; ada hal-hal yang kita tahu kita tahu. Kita juga tahu ada yang diketahui tidak diketahui; artinya kita tahu ada beberapa hal yang tidak kita ketahui. Tapi ada juga yang tidak diketahui tidak diketahui - yang kita tidak tahu kita tidak tahu.
Jika kecenderungan Paskah atau Kanada untuk Hoki tidak diketahui oleh kita, kita terjebak - dan kita bahkan tidak memiliki jalan ke depan, karena kita tidak tahu pertanyaan apa yang perlu kita tanyakan.
Satu-satunya cara untuk menangani ini adalah untuk mengumpulkan pengetahuan domain.
Kesimpulan
Saya menarik tiga kesimpulan dari ini:
- Anda selalu perlu memasukkan pengetahuan domain dalam pemodelan dan prediksi Anda.
- Bahkan dengan pengetahuan domain, Anda tidak dijamin mendapatkan informasi yang cukup untuk perkiraan dan prediksi Anda agar dapat diterima oleh pengguna. Lihat itu di atas.
- Jika "hasil Anda menyedihkan", Anda mungkin berharap lebih dari yang bisa Anda raih. Jika Anda memperkirakan lemparan koin adil, maka tidak ada cara untuk mendapatkan akurasi di atas 50%. Juga jangan percaya tolok ukur akurasi perkiraan eksternal.
Garis bawah
Inilah cara saya akan merekomendasikan membangun model - dan memperhatikan kapan harus berhenti:
- Bicaralah dengan seseorang yang memiliki pengetahuan domain jika Anda belum memilikinya sendiri.
- Identifikasi pendorong utama data yang ingin Anda ramalkan, termasuk kemungkinan interaksi, berdasarkan langkah 1.
- Bangun model secara iteratif, termasuk driver dalam mengurangi urutan kekuatan pada langkah 2. Menilai model menggunakan validasi silang atau sampel penahan.
- Jika akurasi prediksi Anda tidak meningkat lebih jauh, kembali ke langkah 1 (misalnya, dengan mengidentifikasi prediksi salah yang mencolok yang tidak dapat Anda jelaskan, dan mendiskusikannya dengan pakar domain), atau menerima bahwa Anda telah mencapai akhir dari kemampuan model. Kotak-waktu analisis Anda di muka membantu.
Perhatikan bahwa saya tidak menganjurkan mencoba berbagai kelas model jika dataran model asli Anda. Biasanya, jika Anda memulai dengan model yang masuk akal, menggunakan sesuatu yang lebih canggih tidak akan menghasilkan manfaat yang kuat dan mungkin hanya "overfitting pada set tes". Saya sudah sering melihat ini, dan orang lain setuju .