Pertanyaan yang diberi tag «outliers»

Pencilan adalah pengamatan yang tampaknya tidak biasa atau tidak dijelaskan dengan baik relatif terhadap karakterisasi sederhana suatu dataset. Kemungkinan yang mengecewakan adalah bahwa data ini berasal dari populasi yang berbeda dari yang dimaksudkan untuk dipelajari.


3
mengapa metode peningkatan sensitif terhadap outlier
Saya menemukan banyak artikel yang menyatakan bahwa metode peningkatan sensitif terhadap outlier, tetapi tidak ada artikel yang menjelaskan mengapa. Dalam pengalaman saya, pencilan buruk untuk algoritma pembelajaran mesin, tetapi mengapa meningkatkan metode dipilih sebagai sangat sensitif? Bagaimana algoritma berikut akan memberi peringkat dalam hal sensitivitas terhadap pencilan: boost-tree, hutan acak, …

4
Bentuk yang bagus untuk menghapus outlier?
Saya sedang mengerjakan statistik untuk pembuatan perangkat lunak. Saya punya data untuk setiap build on pass / gagal dan waktu yang berlalu dan kami menghasilkan ~ 200 dari ini / minggu. Tingkat keberhasilannya mudah untuk dikumpulkan, saya dapat mengatakan bahwa 45% lulus setiap minggu. Tapi saya juga ingin menggabungkan waktu …

3
STL pada deret waktu dengan nilai yang hilang untuk deteksi anomali
Saya mencoba mendeteksi nilai-nilai anomali dalam serangkaian waktu data iklim dengan beberapa pengamatan yang hilang. Mencari di web saya menemukan banyak pendekatan yang tersedia. Dari semua itu, dekomposisi pertama tampaknya menarik, dalam arti menghilangkan tren dan komponen musiman dan mempelajari sisanya. Membaca STL: Prosedur Dekomposisi Tren Musiman Berdasarkan Loess , …

1
Perbedaan antara PROC Mixed dan lme / lmer dalam R - derajat kebebasan
Catatan: pertanyaan ini adalah repost, karena pertanyaan saya sebelumnya harus dihapus karena alasan hukum. Sambil membandingkan PROC CAMPURAN dari SAS dengan fungsi lmedari nlmepaket di R, saya menemukan beberapa perbedaan yang agak membingungkan. Lebih khusus lagi, derajat kebebasan dalam berbagai tes berbeda antara PROC MIXEDdan lme, dan saya bertanya-tanya mengapa. …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

3
Deteksi outlier dalam set yang sangat kecil
Saya perlu mendapatkan seakurat mungkin nilai untuk kecerahan sumber cahaya yang stabil terutama yang diberikan dua belas nilai luminositas sampel. Sensornya tidak sempurna, dan cahayanya kadang-kadang bisa "berkedip" lebih terang atau lebih gelap, yang bisa diabaikan, karenanya saya perlu deteksi outlier (saya pikir?). Saya sudah membaca beberapa pendekatan di sini …


1
Estimasi yang kuat tentang kurtosis?
Saya menggunakan estimator biasa untuk kurtosis, , tapi saya perhatikan bahwa bahkan 'outlier' kecil dalam distribusi empiris saya , yaitu puncak kecil jauh dari pusat, sangat mempengaruhinya. Apakah ada estimator kurtosis yang lebih kuat?K^= μ^4σ^4K^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}

2
Generalized Linear Mixed Models: Diagnostics
Saya memiliki regresi logistik intersep acak (karena pengukuran berulang) dan saya ingin melakukan beberapa diagnostik, khususnya mengenai pencilan dan pengamatan yang berpengaruh. Saya melihat residu untuk melihat apakah ada pengamatan yang menonjol. Tetapi saya juga ingin melihat jarak seperti Cook atau DFFIT. Hosmer dan Lemeshow (2000) mengatakan bahwa karena kurangnya …

2
Seberapa akurat IQR untuk mendeteksi outlier
Saya sedang menulis skrip yang menganalisis waktu proses yang dijalankan. Saya tidak yakin distribusi mereka tetapi saya ingin tahu apakah suatu proses berjalan "terlalu lama". Sejauh ini saya telah menggunakan 3 standar deviasi dari waktu menjalankan terakhir (n> 30), tetapi saya diberitahu bahwa ini tidak memberikan sesuatu yang berguna jika …

1
Pemilihan fitur otomatis untuk deteksi anomali
Apa cara terbaik untuk memilih fitur secara otomatis untuk deteksi anomali? Saya biasanya memperlakukan Deteksi Anomali sebagai algoritme di mana fitur dipilih oleh para ahli manusia: yang penting adalah kisaran output (seperti pada "input abnormal - output abnormal") sehingga bahkan dengan banyak fitur Anda dapat membuat subset yang jauh lebih …

3
Menemukan titik GPS rata-rata
Saya perlu menulis sebuah program untuk menemukan titik GPS rata-rata dari populasi titik. Dalam praktiknya hal berikut terjadi: Setiap bulan seseorang merekam titik GPS dari aset statis yang sama. Karena sifat GPS, titik-titik ini sedikit berbeda setiap bulan. Kadang-kadang orang membuat kesalahan dan mencatat kesalahan yang salah di lokasi yang …
11 outliers  spatial 

2
Deteksi outlier menggunakan regresi
Dapatkah regresi digunakan untuk deteksi lier. Saya mengerti bahwa ada cara untuk meningkatkan model regresi dengan menghapus outlier. Tetapi tujuan utama di sini bukan untuk mencocokkan model regresi tetapi mencari tahu liers menggunakan regresi

6
Mengidentifikasi outlier untuk regresi non linier
Saya sedang melakukan penelitian di bidang respon fungsional tungau. Saya ingin melakukan regresi untuk memperkirakan parameter (tingkat serangan dan waktu penanganan) dari fungsi Rogers tipe II. Saya memiliki dataset pengukuran. Bagaimana saya bisa menentukan outlier yang terbaik? Untuk regresi saya, saya menggunakan skrip berikut dalam R (regresi non linier): (Dateet …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.