Pertanyaan yang diberi tag «mean»

Nilai yang diharapkan dari variabel acak; atau ukuran lokasi untuk sampel.

2
Apakah versi sampel ketidaksetaraan Chebyshev satu sisi ada?
Saya tertarik pada versi Cantelli satu sisi tentang ketidaksetaraan Chebyshev : P(X−E(X)≥t)≤Var(X)Var(X)+t2.P(X−E(X)≥t)≤Var(X)Var(X)+t2. \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. Pada dasarnya, jika Anda mengetahui mean dan varians populasi, Anda dapat menghitung batas atas pada probabilitas mengamati nilai tertentu. (Setidaknya itu adalah pemahaman saya.) Namun, …

4
Apa manfaat relatif data Winsorizing vs. Trimming?
Data Winsorizing berarti mengganti nilai ekstrem dari kumpulan data dengan nilai persentil tertentu dari masing-masing ujung, sementara Pemangkasan atau Pemotongan melibatkan penghapusan nilai ekstrem tersebut. Saya selalu melihat kedua metode yang dibahas sebagai opsi yang layak untuk mengurangi efek pencilan ketika menghitung statistik seperti mean atau standar deviasi, tetapi saya …

8
Mengganti outlier dengan mean
Pertanyaan ini diajukan oleh teman saya yang tidak mengerti internet. Saya tidak memiliki latar belakang statistik dan saya telah mencari di internet untuk pertanyaan ini. Pertanyaannya adalah: apakah mungkin untuk mengganti outlier dengan nilai rata-rata? jika memungkinkan, apakah ada referensi buku / jurnal untuk mendukung pernyataan ini?

5
Apa perbedaan antara "nilai rata-rata" dan "rata-rata"?
Wikipedia menjelaskan: Untuk kumpulan data, rata-rata adalah jumlah nilai yang dibagi dengan jumlah nilai. Namun definisi ini sesuai dengan apa yang saya sebut "rata-rata" (setidaknya itulah yang saya ingat pelajari). Namun Wikipedia sekali lagi mengutip: Ada langkah-langkah statistik lain yang menggunakan sampel yang membingungkan sebagian orang dengan rata-rata - termasuk …


2
Apakah ada interval kepercayaan nonparametrik yang dapat diandalkan untuk rata-rata distribusi yang miring?
Distribusi yang sangat miring seperti log-normal tidak menghasilkan interval kepercayaan bootstrap yang akurat. Berikut adalah contoh yang menunjukkan bahwa area ekor kiri dan kanan jauh dari ideal 0,025 tidak peduli metode bootstrap apa pun yang Anda coba di R: require(boot) n <- 25 B <- 1000 nsim <- 1000 set.seed(1) …

5
Cara menangani data hierarkis / bersarang dalam pembelajaran mesin
Saya akan menjelaskan masalah saya dengan sebuah contoh. Misalkan Anda ingin memprediksi penghasilan seseorang yang diberikan beberapa atribut: {Usia, Jenis Kelamin, Negara, Wilayah, Kota}. Anda memiliki dataset pelatihan seperti itu train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

10
Regresi terhadap kekeliruan rata-rata vs penjudi
Di satu sisi, saya memiliki regresi ke mean dan di sisi lain saya memiliki kekeliruan penjudi . Kekeliruan Gambler didefinisikan oleh Miller dan Sanjurjo (2019) sebagai "keyakinan keliru bahwa urutan acak memiliki kecenderungan sistematis terhadap pembalikan, yaitu bahwa garis-garis hasil yang serupa lebih cenderung berakhir daripada berlanjut." Misalnya, koin yang …

1
Bisakah derajat kebebasan menjadi angka non-integer?
Ketika saya menggunakan GAM, itu memberi saya sisa DF adalah (baris terakhir dalam kode). Apa artinya? Melampaui contoh GAM, Secara umum, bisakah jumlah derajat kebebasan menjadi angka yang bukan bilangan bulat?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
Bagaimana menemukan centroid berbeda dari menemukan mean?
Saat melakukan pengelompokan hierarkis, seseorang dapat menggunakan banyak metrik untuk mengukur jarak antar cluster. Dua metrik seperti itu menyiratkan perhitungan centroid dan cara titik data dalam kelompok. Apa perbedaan antara mean dan centroid? Bukankah ini titik yang sama di cluster?
26 clustering  mean 

3
Cara menghitung interval kepercayaan rasio dua cara normal
Saya ingin mendapatkan batas untuk interval kepercayaan untuk rasio dua cara. Misalkan, dan menjadi independen, rasio rata-rata . Saya mencoba menyelesaikan: tetapi persamaan itu tidak dapat diselesaikan untuk banyak kasus (tanpa akar). Apakah saya melakukan sesuatu yang salah? Apakah ada pendekatan yang lebih baik? Terima kasih100 ( 1 - α …

3
Apa yang bisa disimpulkan tentang data ketika rata-rata aritmatika sangat dekat dengan rata-rata geometris?
Apakah ada sesuatu yang signifikan tentang rata-rata geometrik dan rata-rata aritmatika yang sangat dekat satu sama lain, katakan ~ 0,1%? Dugaan apa yang dapat dibuat tentang kumpulan data seperti itu? Saya telah bekerja menganalisis set data, dan saya perhatikan bahwa ironisnya nilainya sangat, sangat dekat. Tidak tepat, tapi tutup. Juga, …


4
Mengapa mean cenderung lebih stabil dalam sampel yang berbeda dari median?
Bagian 1.7.2 dari Menemukan Statistik Menggunakan R oleh Andy Fields, dkk, sambil mendaftar nilai rata-rata vs median, menyatakan: ... rerata cenderung stabil pada sampel yang berbeda. Ini setelah menjelaskan banyak kebajikan median, misalnya ... Median relatif tidak terpengaruh oleh skor ekstrem di kedua ujung distribusi ... Mengingat bahwa median relatif …
22 mean  median 


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.