Pertanyaan yang diberi tag «outliers»

Pencilan adalah pengamatan yang tampaknya tidak biasa atau tidak dijelaskan dengan baik relatif terhadap karakterisasi sederhana suatu dataset. Kemungkinan yang mengecewakan adalah bahwa data ini berasal dari populasi yang berbeda dari yang dimaksudkan untuk dipelajari.



1
Bagaimana cara saya memasukkan pencilan inovatif pada pengamatan 48 dalam model ARIMA saya?
Saya sedang mengerjakan kumpulan data. Setelah menggunakan beberapa teknik identifikasi model, saya keluar dengan model ARIMA (0,2,1). Saya menggunakan detectIOfungsi dalam paket TSAdalam R untuk mendeteksi outlier inovatif (IO) pada pengamatan ke-48 set data asli saya. Bagaimana cara memasukkan pencilan ini ke dalam model saya sehingga saya dapat menggunakannya untuk …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Histogram dengan Bins seragam vs non-seragam
Pertanyaan ini menjelaskan perbedaan mendasar antara histogram yang seragam dan yang tidak seragam. Dan pertanyaan ini membahas aturan praktis untuk memilih jumlah tempat sampah dari histogram seragam yang mengoptimalkan (dalam arti tertentu) sejauh mana histogram mewakili distribusi dari mana sampel data diambil. Sepertinya saya tidak dapat menemukan diskusi "optimalitas" yang …

2
Sisa residu vs outlier yang berpengaruh
Pertama, saya harus menyatakan bahwa saya telah mencari jawabannya di situs ini. Saya juga tidak menemukan pertanyaan yang menjawab pertanyaan saya atau tingkat pengetahuan saya sangat rendah sehingga saya tidak menyadari bahwa saya sudah membaca jawabannya. Saya sedang belajar untuk Ujian Statistik AP. Saya harus belajar regresi linier dan salah …

4
Deteksi pencilan online
Saya ingin memproses gambar mikroskop yang tersegmentasi secara otomatis untuk mendeteksi gambar yang salah dan / atau segmentasi yang salah, sebagai bagian dari pipa pencitraan throughput tinggi. Ada sejumlah parameter yang dapat dihitung untuk setiap gambar mentah dan segmentasi, dan itu menjadi "ekstrem" ketika gambar rusak. Misalnya, gelembung dalam gambar …
10 outliers  online 

1
Perbedaan antara Outlier dan Inlier
Saya menemukan istilah inlier dalam ukuran LOF (Local Outlier Factor), saya akrab dengan istilah outlier (pada dasarnya liers - contoh yang tidak berperilaku seperti contoh lainnya). Apa arti 'Inliers' dalam konteks deteksi anomali? dan bagaimana hal itu terkait dengan (berbeda dari) pencilan?

2
Bagaimana menafsirkan dan melakukan peramalan menggunakan paket tsoutliers dan auto.arima
Saya sudah mendapatkan data bulanan dari tahun 1993 hingga 2015 dan ingin melakukan perkiraan data ini. Saya menggunakan paket tsoutliers untuk mendeteksi outliers, tetapi saya tidak tahu bagaimana cara melanjutkan perkiraan dengan set data saya. Ini kode saya: product.outlier<-tso(product,types=c("AO","LS","TC")) plot(product.outlier) Ini adalah output saya dari paket tsoutliers ARIMA(0,1,0)(0,0,1)[12] Coefficients: sma1 …

2
Pengujian ulang atau validasi silang ketika proses pembuatan model bersifat interaktif
Saya memiliki beberapa model prediktif yang kinerjanya ingin saya uji kembali (yaitu, ambil dataset saya, "putar kembali" ke titik waktu sebelumnya, dan lihat bagaimana model tersebut akan tampil secara prospektif). Masalahnya adalah bahwa beberapa model saya dibangun melalui proses interaktif. Misalnya, mengikuti saran dalam Strategi Pemodelan Regresi Frank Harrell , …

2
Berarti dipangkas vs median
Saya memiliki satu set data dengan semua panggilan yang dilakukan ke layanan darurat dan waktu respons dari departemen ambulans. Mereka mengakui bahwa ada beberapa kesalahan dengan waktu respons karena ada kasus di mana mereka tidak mulai merekam (jadi nilainya 0) atau di mana mereka tidak menghentikan jam (sehingga nilainya bisa …

6
Cara menyiapkan / membuat fitur untuk deteksi anomali (data keamanan jaringan)
Tujuan saya adalah untuk menganalisis log jaringan (mis., Apache, syslog, audit keamanan Direktori Aktif, dan sebagainya) menggunakan deteksi pengelompokan / anomali untuk tujuan deteksi intrusi. Dari log saya memiliki banyak bidang teks seperti alamat IP, nama pengguna, nama host, port tujuan, port sumber, dan sebagainya (total 15-20 bidang). Saya tidak …

1
Memilih nilai k untuk analisis deteksi Local Outlier Factor (LOF)
Saya memiliki satu set data tiga dimensi, dan saya mencoba menggunakan analisis Local Outlier Factor untuk mengidentifikasi nilai yang paling unik atau aneh. Bagaimana seseorang memutuskan nilai k untuk digunakan dalam analisis LOF? Saya mengerti apa yang menentukan nilai-k, dan jadi saya tidak terkejut bahwa saya melihat hasil yang sedikit …


1
Nilai batas jarak Cook
Saya telah membaca tentang jarak juru masak untuk mengidentifikasi outlier yang memiliki pengaruh besar pada regresi saya. Dalam penelitian asli Cook, ia mengatakan bahwa tingkat cut-off 1 harus sebanding dengan mengidentifikasi influencer. Namun, berbagai penelitian lain menggunakan atau44n4n\frac{4}{n} sebagai cut-off.4n - k - 14n-k-1\frac{4}{n-k-1} Dalam penelitian saya, tidak ada residu …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.