Pertanyaan yang diberi tag «r-squared»

Koefisien determinasi, biasanya dilambangkan dengan , adalah proporsi dari total varian respon yang dijelaskan oleh model regresi. Dapat juga digunakan untuk berbagai pseudo R-squared yang diusulkan, misalnya untuk regresi logistik (dan model lainnya.) R2

6
Apakah
Saya membaca beberapa catatan kuliah oleh Cosma Shalizi (khususnya, bagian 2.1.1 dari kuliah kedua ), dan diingatkan bahwa Anda bisa mendapatkan sangat rendah bahkan ketika Anda memiliki model yang sepenuhnya linier.R2R2R^2 Mengutip contoh Shalizi: misalkan Anda memiliki model , di mana dikenal. Kemudian dan jumlah varian yang dijelaskan adalah ^ …


2
Penghapusan istilah intersepsi yang signifikan secara statistik meningkatkan dalam model linier
Dalam model linier sederhana dengan variabel penjelas tunggal, αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Saya menemukan bahwa menghapus istilah intersepsi sangat meningkatkan kecocokan (nilai berubah dari 0,3 menjadi 0,9). Namun, istilah intersepsi tampaknya signifikan secara statistik.R2R2R^2 Dengan mencegat: Call: lm(formula = alpha ~ delta, data = cf) Residuals: …

3
Kapan R kuadrat negatif?
Pemahaman saya adalah bahwa tidak dapat negatif karena merupakan persegi R. Namun aku berlari regresi linier sederhana dalam SPSS dengan satu variabel bebas dan variabel terikat. Output SPSS saya memberi saya nilai negatif untuk R 2 . Jika saya menghitung ini dengan tangan dari R maka R 2 akan positif. …


3
Interpretasi dari prediktor dan / atau respons yang diubah log
Saya bertanya-tanya apakah itu membuat perbedaan dalam interpretasi apakah hanya dependen, baik dependen dan independen, atau hanya variabel independen yang ditransformasikan log. Pertimbangkan kasus log(DV) = Intercept + B1*IV + Error Saya bisa menafsirkan IV sebagai peningkatan persen tetapi bagaimana ini berubah ketika saya punya log(DV) = Intercept + B1*log(IV) …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

5
Hubungan antara
Katakanlah saya memiliki dua array 1 dimensi, dan sebuah 2 . Masing-masing berisi 100 poin data. a 1 adalah data aktual, dan sebuah 2 adalah model prediksi. Dalam hal ini, nilai R 2 adalah: R 2 = 1 - S S r e sa1a1a_1a2a2a_2a1a1a_1a2a2a_2R2R2R^2 Sementara itu, ini akan sama dengan …

1
dihitung secara manual tidak cocok dengan randomForest () untuk menguji data baru
Saya tahu ini adalah Rpertanyaan yang cukup spesifik , tetapi saya mungkin berpikir tentang perbedaan proporsi yang dijelaskan, , salah. Ini dia.R2R2R^2 Saya mencoba menggunakan Rpaket randomForest. Saya memiliki beberapa data pelatihan dan data pengujian. Ketika saya cocok dengan model hutan acak, randomForestfungsi ini memungkinkan Anda untuk memasukkan data pengujian …


1
Apa perbedaan antara "koefisien determinasi" dan "mean squared error"?
Untuk masalah regresi, saya telah melihat orang menggunakan "koefisien determinasi" (alias R kuadrat) untuk melakukan pemilihan model, misalnya, menemukan koefisien penalti yang tepat untuk regularisasi. Namun, itu juga umum untuk menggunakan "mean squared error" atau "root mean squared error" sebagai ukuran akurasi regresi. Jadi apa perbedaan utama antara keduanya? Bisakah …

5
Cara menangani data hierarkis / bersarang dalam pembelajaran mesin
Saya akan menjelaskan masalah saya dengan sebuah contoh. Misalkan Anda ingin memprediksi penghasilan seseorang yang diberikan beberapa atribut: {Usia, Jenis Kelamin, Negara, Wilayah, Kota}. Anda memiliki dataset pelatihan seperti itu train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
Formula kuadrat Pseudo R untuk GLM
Saya menemukan formula untuk pseudo R2R2R^2 dalam buku Extending the Linear Model with R, Julian J. Faraway (hlm. 59). 1−ResidualDevianceNullDeviance1−ResidualDevianceNullDeviance1-\frac{\text{ResidualDeviance}}{\text{NullDeviance}} . Apakah ini formula umum untuk pseudo untuk GLM?R2R2R^2

2
Apa distribusi dalam regresi linier di bawah hipotesis nol? Mengapa modenya tidak nol ketika ?
Apa distribusi koefisien determinasi, atau R kuadrat, , dalam regresi berganda univariat linier di bawah hipotesis nol ?R2R2R^2H0:β=0H0:β=0H_0:\beta=0 Bagaimana hal itu tergantung pada jumlah prediktor dan jumlah sampel ? Apakah ada ekspresi bentuk tertutup untuk mode distribusi ini?kkkn>kn>kn>k Secara khusus, saya merasa bahwa untuk regresi sederhana (dengan satu prediktor ) …

9
Mengukur akurasi model berbasis regresi logistik
Saya memiliki model regresi logistik terlatih yang saya terapkan pada set data pengujian. Variabel dependen adalah biner (boolean). Untuk setiap sampel dalam set data pengujian, saya menerapkan model regresi logistik untuk menghasilkan probabilitas% bahwa variabel dependen akan benar. Lalu saya mencatat apakah nilai acutal itu benar atau salah. Saya mencoba …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.