Pertanyaan yang diberi tag «regression»

Teknik untuk menganalisis hubungan antara satu (atau lebih) variabel "tergantung" dan variabel "independen".

4
Regresi linier yang cepat kuat untuk pencilan
Saya berurusan dengan data linear dengan outlier, beberapa di antaranya berada pada 5 standar deviasi dari garis regresi yang diperkirakan. Saya mencari teknik regresi linier yang mengurangi pengaruh poin-poin ini. Sejauh ini yang saya lakukan adalah memperkirakan garis regresi dengan semua data, kemudian membuang titik data dengan residu kuadrat yang …

1
Pengkodean satu-panas vs dummy di Scikit-learn
Ada dua cara berbeda untuk menyandikan variabel kategori. Katakanlah, satu variabel kategori memiliki nilai n . Pengkodean satu-panas mengkonversinya menjadi n variabel, sedangkan pengkodean dummy mengubahnya menjadi variabel n-1 . Jika kita memiliki variabel k kategori, masing-masing memiliki nilai n . Satu pengkodean panas berakhir dengan variabel kn , sedangkan …

2
Apakah ada perbedaan antara 'mengendalikan untuk' dan 'mengabaikan' variabel lain dalam regresi berganda?
Koefisien variabel penjelas dalam regresi berganda memberi tahu kita hubungan variabel penjelas dengan variabel terikat. Semua ini, sambil 'mengendalikan' untuk variabel penjelas lainnya. Bagaimana saya melihatnya sejauh ini: Sementara masing-masing koefisien sedang dihitung, variabel-variabel lain tidak diperhitungkan, jadi saya menganggap mereka diabaikan. Jadi apakah saya benar ketika saya berpikir bahwa …

4
Mengapa ANOVA setara dengan regresi linier?
Saya membaca bahwa ANOVA dan regresi linier adalah hal yang sama. Bagaimana bisa, mengingat bahwa output ANOVA adalah beberapa nilai dan beberapa p- nilai berdasarkan yang Anda simpulkan jika sampel berarti di sampel yang berbeda adalah sama atau berbeda.FFFppp Tetapi dengan asumsi cara tidak sama (menolak hipotesis nol), ANOVA tidak …
50 regression  anova 



7
Di mana harus memulai dengan statistik untuk pengembang yang berpengalaman
Selama paruh pertama 2015 saya melakukan kursus coursera Machine Learning (oleh Andrew Ng, GREAT course). Dan mempelajari dasar-dasar pembelajaran mesin (regresi linier, regresi logistik, SVM, Jaringan Neuronal ...) Saya juga telah menjadi pengembang selama 10 tahun, jadi belajar bahasa pemrograman baru tidak akan menjadi masalah. Akhir-akhir ini, saya sudah mulai …


2
Apakah splines overfitting data?
Masalah saya : Baru-baru ini saya bertemu dengan ahli statistik yang memberi tahu saya bahwa splines hanya berguna untuk mengeksplorasi data dan mengalami overfitting, sehingga tidak berguna dalam prediksi. Dia lebih suka menjelajahi dengan polinomial sederhana ... Karena saya penggemar berat spline, dan ini bertentangan dengan intuisi saya, saya tertarik …

5
Jika uji-t dan ANOVA untuk dua kelompok adalah setara, mengapa asumsi mereka tidak sama?
Saya yakin saya sudah membungkus ini sepenuhnya di kepala saya, tetapi saya tidak bisa memahaminya. Uji-t membandingkan dua distribusi normal menggunakan distribusi Z. Itu sebabnya ada asumsi normalitas dalam DATA. ANOVA setara dengan regresi linier dengan variabel dummy, dan menggunakan jumlah kuadrat, sama seperti OLS. Itu sebabnya ada asumsi normalitas …

5
Memahami regresi - peran model
Bagaimana model regresi dapat digunakan jika Anda tidak tahu fungsi yang Anda cari parameternya? Saya melihat sebuah penelitian yang mengatakan bahwa ibu yang menyusui anak-anak mereka cenderung menderita diabetes di kemudian hari. Penelitian ini berasal dari survei terhadap sekitar 1.000 ibu dan dikontrol untuk faktor-faktor lain-lain dan model loglinear digunakan. …

4
Apa itu matriks kontras?
Apa sebenarnya matriks kontras (istilah, yang berkaitan dengan analisis dengan prediktor kategoris) dan bagaimana tepatnya matriks kontras ditentukan? Yaitu apa kolom, apa baris, apa kendala pada matriks itu dan apa arti angka dalam kolom jdan baris i? Saya mencoba melihat ke dalam dokumen dan web tetapi tampaknya semua orang menggunakannya …


3
Interpretasi dari prediktor dan / atau respons yang diubah log
Saya bertanya-tanya apakah itu membuat perbedaan dalam interpretasi apakah hanya dependen, baik dependen dan independen, atau hanya variabel independen yang ditransformasikan log. Pertimbangkan kasus log(DV) = Intercept + B1*IV + Error Saya bisa menafsirkan IV sebagai peningkatan persen tetapi bagaimana ini berubah ketika saya punya log(DV) = Intercept + B1*log(IV) …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

3
Dari mana datangnya kesalahpahaman bahwa Y harus didistribusikan secara normal?
Tampaknya sumber yang memiliki reputasi baik menyatakan bahwa variabel dependen harus didistribusikan secara normal: Asumsi model: terdistribusi secara normal, kesalahan terdistribusi normal, , dan independen, dan diperbaiki, dan varians konstan .e i ∼ N ( 0 , σ 2 ) X σ 2YYYei∼N(0,σ2)ei∼N(0,σ2)e_i \sim N(0,\sigma^2)XXXσ2σ2\sigma^2 Penn State, STAT 504 Analisis …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.