tl; dr
- Apa cara yang disarankan untuk menangani
discrete
data saat melakukan deteksi anomali? - Apa cara yang disarankan untuk menangani
categorical
data saat melakukan deteksi anomali? - Jawaban ini menyarankan menggunakan data diskrit untuk menyaring hasil saja.
- Mungkin mengganti nilai kategori dengan peluang pengamatan perctage?
Intro
Ini adalah pertama kalinya saya memposting di sini, jadi tolong, jika ada sesuatu yang tampaknya tidak benar secara teknis, baik dalam format, atau penggunaan definisi yang benar, saya tertarik untuk mengetahui apa yang seharusnya digunakan.
Dan seterusnya.
Baru-baru ini saya mengikuti kelas Pembelajaran Mesin oleh Andrew Ng
Untuk deteksi anomali kita telah diajarkan untuk menentukan apa parameter distribusi Normal / Gaussian untuk fitur / variabel tertentu, dalam set data, dan kemudian menentukan probabilitas set contoh pelatihan / nilai pengamatan yang dipilih dengan nilai tertentu Distribusi Gaussian, dan kemudian mengambil produk dari probabilitas fitur.
metode
Pilih dilengkapi / variabel yang menurut kami menjelaskan kegiatan tersebut: { x 1 , x 2 , ... , x i }
Sesuaikan parameter Gaussian untuk setiap fitur: σ2=1
Untuk setiap contoh pelatihan, , hitung: p ( x ) = n ∏ j = 1 p ( x j ; μ j , σ 2 j )
Kami kemudian menandai sebagai anomali ( ), diberikan: y = { 1
Ini memberi kita metode yang dapat digunakan untuk menentukan apakah suatu contoh membutuhkan pemeriksaan lebih lanjut.
Pertanyaan saya)
Ini tampaknya baik untuk variabel / fitur kontinu, tetapi data diskrit tidak ditangani.
Pertanyaan: (diperbarui: 2015-11-24)
Apakah ada metode lain yang mempertimbangkan apa yang saya tanyakan di sini yang dapat saya teliti lebih lanjut?- Apa cara yang disarankan untuk menangani
discrete
data saat melakukan deteksi anomali? - Apa cara yang disarankan untuk menangani
categorical
data saat melakukan deteksi anomali?
Edit: 2017-05-03
- Jawaban ini menyarankan menggunakan data diskrit untuk menyaring hasil saja.
- Mungkin mengganti nilai kategori dengan peluang pengamatan perctage?