Pertanyaan yang diberi tag «outliers»

Pencilan adalah pengamatan yang tampaknya tidak biasa atau tidak dijelaskan dengan baik relatif terhadap karakterisasi sederhana suatu dataset. Kemungkinan yang mengecewakan adalah bahwa data ini berasal dari populasi yang berbeda dari yang dimaksudkan untuk dipelajari.

4
Mendeteksi outlier menggunakan standar deviasi
Mengikuti pertanyaan saya di sini , saya bertanya-tanya apakah ada pandangan yang kuat untuk atau menentang penggunaan deviasi standar untuk mendeteksi outlier (misalnya setiap titik data yang lebih dari 2 deviasi standar adalah outlier). Saya tahu ini tergantung pada konteks penelitian, misalnya titik data, 48kg, pasti akan menjadi pencilan dalam …
27 outliers 


4
Mengapa RANSAC tidak digunakan secara luas dalam statistik?
Berasal dari bidang visi komputer, saya sering menggunakan metode RANSAC (Random Sample Consensus) untuk memasang model ke data dengan banyak outlier. Namun, saya belum pernah melihatnya digunakan oleh ahli statistik, dan saya selalu mendapat kesan bahwa itu tidak dianggap metode "statistik-suara". Kenapa begitu? Sifatnya acak, yang membuatnya lebih sulit untuk …


3
Deteksi Outlier pada Distribusi miring
Di bawah definisi klasik dari pencilan sebagai titik data di luar 1,5 * IQR dari kuartil atas atau bawah, ada asumsi distribusi tidak miring. Untuk distribusi miring (Eksponensial, Poisson, Geometris, dll) adalah cara terbaik untuk mendeteksi pencilan dengan menganalisis transformasi fungsi asli? Misalnya, distribusi yang secara longgar diatur oleh distribusi …


2
Distribusi jarak pengamatan tingkat Mahalanobis
Jika saya memiliki sampel iid multivariat normal , dan tentukan (yang merupakan semacam jarak Mahalanobis [kuadrat] dari titik sampel ke vektor menggunakan matriks untuk menentukan bobot), berapakah distribusi (jarak Mahalanobis ke sampel mean menggunakan sampel kovarians matriks )?d 2 i ( b , A ) = ( X i - …

4
Apakah akan menghapus kasus yang ditandai sebagai outlier oleh perangkat lunak statistik saat melakukan regresi berganda?
Saya melakukan beberapa analisis regresi dan saya tidak yakin apakah outlier dalam data saya harus dihapus. Data yang saya khawatirkan muncul sebagai "lingkaran" pada kotak-kotak SPSS, namun tidak ada tanda bintang (yang membuat saya berpikir mereka tidak 'seburuk itu'). Kasus-kasus yang saya khawatirkan akan muncul di bawah tabel "diagnosa santai" …

1
Mendeteksi pencilan dalam data hitungan
Saya memiliki apa yang saya anggap naif sebagai masalah yang cukup lurus ke depan yang melibatkan deteksi outlier untuk banyak set data penghitungan yang berbeda. Secara khusus, saya ingin menentukan apakah satu atau lebih nilai dalam serangkaian data jumlah lebih tinggi atau lebih rendah dari yang diharapkan relatif terhadap sisa …

3
Bagaimana cara menilai kemiringan dari kotak petak?
Cara memutuskan kemiringan dengan melihat plot kotak yang dibangun dari data ini: 340, 300, 520, 340, 320, 290, 260, 330 Satu buku mengatakan, "Jika kuartil bawah lebih jauh dari median daripada kuartil atas, maka distribusinya cenderung negatif." Beberapa sumber lain mengatakan kurang lebih sama. Saya membuat boxplot menggunakan R. Ini …

2
Bootstrapping - apakah saya harus menghapus outlier terlebih dahulu?
Kami telah menjalankan uji coba fitur produk baru dan ingin mengukur apakah peningkatan pada pendapatan signifikan. Pengamatan kami jelas tidak terdistribusi normal (sebagian besar pengguna kami tidak membelanjakan, dan di antara mereka yang melakukannya, sangat condong ke banyak pembelanja kecil dan beberapa pembelanja sangat besar). Kami telah memutuskan untuk menggunakan …

2
Deteksi Anomali dengan Fitur Dummy (dan Fitur Diskrit / Kategorikal lainnya)
tl; dr Apa cara yang disarankan untuk menangani discretedata saat melakukan deteksi anomali? Apa cara yang disarankan untuk menangani categoricaldata saat melakukan deteksi anomali? Jawaban ini menyarankan menggunakan data diskrit untuk menyaring hasil saja. Mungkin mengganti nilai kategori dengan peluang pengamatan perctage? Intro Ini adalah pertama kalinya saya memposting di …

4
Apa dasar dari definisi outlier Box dan Whisker Plot?
Definisi standar pencilan untuk plot Kotak dan Kumis adalah poin di luar rentang , di mana dan adalah kuartil pertama dan adalah kuartil ketiga dari data.{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 Apa dasar dari definisi ini? Dengan sejumlah besar poin, bahkan distribusi yang normal sekalipun menghasilkan outlier. Misalnya, Anda mulai dengan urutan: xseq<-seq(1-.5^1/4000,.5^1/4000, by …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.