Pertanyaan yang diberi tag «goodness-of-fit»

Tes Goodness of fit mengindikasikan apakah masuk akal untuk menganggap bahwa sampel acak berasal dari distribusi tertentu.

5
Bisakah saya menguji hipotesis untuk data normal condong?
Saya memiliki kumpulan data, yang awalnya saya pikir didistribusikan secara normal. Kemudian saya benar-benar melihatnya, dan menyadari itu tidak, sebagian besar karena data miring, dan saya juga melakukan tes shapiro-wilks. Saya masih ingin menganalisisnya menggunakan metode statistik, jadi saya ingin menguji hipotesis untuk kemiringan normal. Jadi saya ingin tahu apakah …

2
Tes Kolmogorov – Smirnov: statistik p-value dan ks-test menurun ketika ukuran sampel meningkat
Mengapa statistik p-value dan ks-test menurun dengan meningkatnya ukuran sampel? Ambil kode Python ini sebagai contoh: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Hasilnya adalah: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) …


3
Bagaimana memvisualisasikan kebaikan Bayesian of fit untuk regresi logistik
Untuk masalah regresi logistik Bayesian, saya telah membuat distribusi prediksi posterior. Saya sampel dari distribusi prediktif dan menerima ribuan sampel (0,1) untuk setiap pengamatan yang saya miliki. Memvisualisasikan kebaikan tidak terlalu menarik, misalnya: Plot ini menunjukkan 10 000 sampel + titik datum yang diamati (cara di sebelah kiri dapat melihat …



1
Bagaimana cara menggambar grafik yang pas dan grafik sebenarnya dari distribusi gamma dalam satu plot?
Muat paket yang dibutuhkan. library(ggplot2) library(MASS) Hasilkan 10.000 angka yang pas untuk distribusi gamma. x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] Gambarkan fungsi kerapatan probabilitas, seandainya kita tidak tahu distribusi x mana yang cocok. t1 <- as.data.frame(table(x)) names(t1) <- c("x","y") t1 <- transform(t1,x=as.numeric(as.character(x))) t1$y <- t1$y/sum(t1[,2]) ggplot() …

4
Model Sejarah Acara Diskrit-Waktu (Bertahan Hidup) di R
Saya mencoba menyesuaikan model waktu-diskrit dalam R, tapi saya tidak yakin bagaimana melakukannya. Saya telah membaca bahwa Anda dapat mengatur variabel dependen dalam baris yang berbeda, satu untuk setiap pengamatan waktu, dan menggunakan glmfungsi dengan logit atau tautan cloglog. Dalam hal ini, saya memiliki tiga kolom: ID, Event(1 atau 0, …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

4
Bagaimana saya bisa menghitung statistik uji
Uji rasio kemungkinan (alias penyimpangan) G2G2G^2 dan uji ketidakcocokan (atau good-of-fit) cukup mudah untuk mendapatkan model regresi logistik (cocok menggunakan glm(..., family = binomial)fungsi) dalam R. Namun, bisa mudah untuk memiliki jumlah sel berakhir cukup rendah sehingga tes tidak dapat diandalkan. Salah satu cara untuk memverifikasi keandalan uji rasio kemungkinan …




2
Hitung kurva ROC untuk data
Jadi, saya memiliki 16 percobaan di mana saya mencoba untuk mengotentikasi seseorang dari sifat biometrik menggunakan Hamming Distance. Ambang batas saya diatur ke 3.5. Data saya di bawah dan hanya percobaan 1 yang Benar-Benar Positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
Goodness of fit untuk data diskrit: pendekatan terbaik
Data: Untuk keperluan pertanyaan / komunikasi ini kita dapat mengasumsikan data tampak seperti rnbinom(1000,size=0.1,prob=0.01)dalam R, yang menghasilkan sampel acak dari 1.000 pengamatan dari distribusi binomial negatif (dengan size=0.1dan probabilitas keberhasilan prob=0.01). Ini adalah parametrization di mana variabel acak mewakili jumlah kegagalan sebelum sizejumlah keberhasilan. Ekornya panjang, dan 1.000 pengamatan tidak …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.