Saya mencoba untuk mengotomatisasi deteksi outlier dalam time-series dan saya menggunakan modifikasi dari solusi yang diusulkan oleh Rob Hyndman di sini .
Katakanlah, saya mengukur kunjungan harian ke situs web dari berbagai negara. Untuk beberapa negara di mana kunjungan hariannya beberapa hundrend atau ribuan, metode saya tampaknya cukup berhasil.
Namun, dalam kasus di mana suatu negara hanya mengarah pada 1 atau 2 kunjungan per hari, batas algoritme sangat sempit (misalnya 1 ± 0,001) dan oleh karena itu 2 kunjungan dianggap sebagai pencilan. Bagaimana saya bisa secara otomatis mendeteksi kasus-kasus seperti itu dan bagaimana saya bisa memperlakukan mereka untuk mengidentifikasi pencilan? Saya tidak ingin menetapkan ambang manual, katakanlah, 100 kunjungan per hari.
Terima kasih!