Pertanyaan yang diberi tag «normality-assumption»

Banyak metode statistik menganggap data terdistribusi normal. Gunakan tag ini untuk pertanyaan tentang asumsi & pengujian normalitas, atau tentang normalitas sebagai * properti *. Gunakan [distribusi normal] untuk pertanyaan tentang distribusi normal per se.


4
Transformasi untuk meningkatkan kurtosis dan skewness rv normal
Saya sedang mengerjakan suatu algoritma yang mengandalkan fakta bahwa pengamatan terdistribusi secara normal, dan saya ingin menguji kekokohan algoritma terhadap asumsi ini secara empiris.YYY Untuk melakukan hal ini, saya sedang mencari urutan transformasi yang progresif akan mengganggu normalitas Y . Sebagai contoh jika Y s normal mereka memiliki kemiringan = …

4
Apa nilai yang benar untuk presisi dan mengingat dalam kasus tepi?
Presisi didefinisikan sebagai: p = true positives / (true positives + false positives) Apakah benar bahwa, sebagai true positivesdan false positivespendekatan 0, presisi mendekati 1? Pertanyaan yang sama untuk diingat: r = true positives / (true positives + false negatives) Saat ini saya sedang menerapkan tes statistik di mana saya …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


2
Bagaimana cara menguji perbedaan antara dua kelompok berarti ketika data tidak terdistribusi secara normal?
Saya akan menghilangkan semua detail biologis dan eksperimen dan hanya mengutip masalah yang ada dan apa yang telah saya lakukan secara statistik. Saya ingin tahu apakah itu benar, dan jika tidak, bagaimana melanjutkan. Jika data (atau penjelasan saya) tidak cukup jelas, saya akan mencoba menjelaskan lebih baik dengan mengedit. Misalkan …

4
Apa dasar dari definisi outlier Box dan Whisker Plot?
Definisi standar pencilan untuk plot Kotak dan Kumis adalah poin di luar rentang , di mana dan adalah kuartil pertama dan adalah kuartil ketiga dari data.{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 Apa dasar dari definisi ini? Dengan sejumlah besar poin, bahkan distribusi yang normal sekalipun menghasilkan outlier. Misalnya, Anda mulai dengan urutan: xseq<-seq(1-.5^1/4000,.5^1/4000, by …


2
Mengapa uji-F sangat sensitif terhadap asumsi normalitas?
Mengapa uji- F untuk perbedaan varian sangat sensitif terhadap asumsi distribusi normal, bahkan untuk besar ?NNN Saya sudah mencoba mencari di web dan mengunjungi perpustakaan, tetapi tidak ada yang memberikan jawaban yang baik. Dikatakan bahwa tes ini sangat sensitif untuk pelanggaran asumsi untuk distribusi normal, tetapi saya tidak mengerti mengapa. …

5
Bagaimana distribusi sampel dari sampel berarti perkiraan populasi?
Saya mencoba mempelajari statistik karena saya menemukan itu sangat lazim sehingga melarang saya belajar beberapa hal jika saya tidak memahaminya dengan benar. Saya mengalami kesulitan memahami gagasan tentang distribusi sampling dari rata-rata sampel. Saya tidak dapat memahami cara beberapa buku dan situs menjelaskannya. Saya pikir saya memiliki pemahaman tetapi tidak …

2
Berulang langkah ANOVA: apa asumsi normalitas?
Saya bingung tentang asumsi normalitas dalam tindakan berulang ANOVA. Secara khusus, saya bertanya-tanya normalitas seperti apa yang harus dipenuhi. Dalam membaca literatur dan jawaban pada CV, saya menemukan tiga kata berbeda dari asumsi ini. Variabel dependen dalam setiap kondisi (berulang) harus didistribusikan secara normal. Sering dinyatakan bahwa rANOVA memiliki asumsi …


1
Paket GBM vs. Caret menggunakan GBM
Saya telah menggunakan model tuning caret, tetapi kemudian menjalankan kembali model menggunakan gbmpaket. Ini adalah pemahaman saya bahwa caretpaket menggunakan gbmdan hasilnya harus sama. Namun, hanya menjalankan tes cepat menggunakan data(iris)menunjukkan perbedaan dalam model sekitar 5% menggunakan RMSE dan R ^ 2 sebagai metrik evaluasi. Saya ingin menemukan kinerja model …

2
Berangkat dari asumsi normalitas dalam ANOVA: apakah kurtosis atau skewness lebih penting?
Model statistik linier yang diterapkan oleh Kutner et al. menyatakan berikut tentang keberangkatan dari asumsi normalitas model ANOVA: Kurtosis distribusi kesalahan (lebih atau kurang memuncak dari distribusi normal) lebih penting daripada kemiringan distribusi dalam hal efek pada kesimpulan . Saya agak bingung dengan pernyataan ini dan tidak berhasil menemukan informasi …


5
Bagaimana cara melakukan imputasi nilai dalam jumlah poin data yang sangat besar?
Saya memiliki dataset yang sangat besar dan sekitar 5% nilai acak hilang. Variabel-variabel ini berkorelasi satu sama lain. Contoh berikut dataset R hanyalah contoh mainan dengan data berkorelasi dummy. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.