Apa metode terbaik untuk menyesuaikan 'mode' data sampel dari distribusi kontinu?
Karena mode ini secara teknis tidak terdefinisi (kanan?) Untuk distribusi kontinu, saya benar-benar bertanya 'bagaimana Anda menemukan nilai yang paling umum'?
Jika Anda menganggap distribusi induk adalah gaussian, Anda dapat meng-bin data dan menemukan mengatakan mode adalah lokasi bin dengan jumlah terbesar. Namun, bagaimana Anda menentukan ukuran nampan? Apakah ada implementasi yang kuat? (Yaitu, kuat untuk outlier). Saya menggunakan python
/ scipy
/ numpy
, tapi saya mungkin bisa menerjemahkan R
tanpa kesulitan terlalu banyak.