Saya memiliki vektor dan ingin mendeteksi outlier di dalamnya.
Gambar berikut menunjukkan distribusi vektor. Poin merah adalah outlier. Poin biru adalah poin normal. Titik kuning juga normal.
Saya memerlukan metode deteksi outlier (metode non-parametrik) yang hanya dapat mendeteksi titik merah sebagai outlier. Saya menguji beberapa metode seperti IQR, standar deviasi tetapi mereka mendeteksi titik kuning sebagai outlier juga.
Saya tahu sulit mendeteksi hanya titik merah tapi saya pikir harus ada cara (bahkan kombinasi metode) untuk menyelesaikan masalah ini.
Poin adalah pembacaan sensor selama sehari. Tetapi nilai-nilai sensor berubah karena konfigurasi ulang sistem (lingkungan tidak statis). Waktu konfigurasi ulang tidak diketahui. Poin biru adalah untuk periode sebelum konfigurasi ulang. Poin kuning adalah untuk setelah konfigurasi ulang yang menyebabkan penyimpangan dalam distribusi bacaan (tetapi normal). Poin merah adalah hasil modifikasi ilegal dari poin kuning. Dengan kata lain, mereka adalah anomali yang harus dideteksi.
Saya ingin tahu apakah estimasi fungsi pemulusan Kernel ('pdf', 'survivor', 'cdf', dll.) Dapat membantu atau tidak. Adakah yang bisa membantu tentang fungsi utama mereka (atau metode perataan lainnya) dan pembenaran untuk digunakan dalam konteks untuk menyelesaikan masalah?