Pertanyaan yang diberi tag «regression»

Teknik untuk menganalisis hubungan antara satu (atau lebih) variabel "tergantung" dan variabel "independen".


1
Membandingkan residu antara regresi OLS dan non-OLS
Misalkan Anda ingin memperkirakan model linier: ( pengamatan respons, dan prediktor) nnnp+1p+1p+1E(yi)=β0+∑j=1pβjxijE(yi)=β0+∑j=1pβjxij\mathbb{E}(y_i) = \beta_0 + \sum_{j=1}^p \beta_j x_{ij} Salah satu cara untuk melakukan ini adalah melalui solusi OLS, yaitu memilih koefisien sehingga jumlah kesalahan kuadrat minimum: (β0,β1, ⋯ ,βhal)T=argminβ0,β1, ⋯ ,βhal∑i = 1n(ysaya-β0-∑j = 1halβjxsaya j)2(β0,β1,⋯,βhal)T=arg⁡minβ0,β1,⋯,βhal∑saya=1n(ysaya-β0-∑j=1halβjxsayaj)2(\beta_0,\beta_1,\cdots,\beta_p)^T = \underset{\beta_0,\beta_1,\cdots,\beta_p}{\arg \min} \sum_{i=1}^{n} …

2
Regresi berganda dalam statistik directional / circular?
Saya mencoba mengembangkan model prediksi untuk variabel dependen sudut (pada menggunakan beberapa pengukuran independen - juga variabel sudut, pada - sebagai prediktor. Setiap prediktor secara signifikan tetapi tidak berkorelasi sangat kuat dengan variabel dependen. Bagaimana saya bisa menggabungkan prediktor untuk menentukan model prediksi untuk variabel dependen yang optimal dalam beberapa …

1
Pengujian untuk penyebaran berlebihan dalam regresi logistik
R in Action (Kabacoff, 2011) menyarankan rutinitas berikut untuk menguji penyebaran berlebihan dalam regresi logistik: Fit regresi logistik menggunakan distribusi binomial: model_binom <- glm(Species=="versicolor" ~ Sepal.Width, family=binomial(), data=iris) Fit regresi logistik menggunakan distribusi quasibinomial: model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width, family=quasibinomial(), data=iris) Gunakan chi-squared untuk menguji penyebaran berlebihan: pchisq(summary(model_overdispersed)$dispersion * model_binom$df.residual, …

4
Mengevaluasi model regresi
Untuk masalah klasifikasi saya telah menggunakan Neural Networks dan mengukur kesalahan Tipe I dan II menggunakan matriks kebingungan dan ukurannya sesuai sumber daya ini ( mirror ), yang cukup mudah. Ketika dihadapkan dengan masalah estimasi, bagaimana seseorang menilai kinerja model? Dengan asumsi bahwa tidak ada kelas dan output ditafsirkan dalam …

1
Apa arti intuitif di balik tujuan dan mekanisme Statistik yang Memadai?
Definisi statistik yang memadai adalah: Biarkan X1,...,XnX1,...,XnX_1,...,X_n menjadi sampel acak dari distribusi yang diindeks oleh parameter θθ\theta. MembiarkanTTTmenjadi statistik. Misalkan, untuk setiapθθ\theta dan setiap nilai yang mungkin ttt dari TTT, distribusi bersama bersyarat dari X1,...,XnX1,...,XnX_1,...,X_n mengingat bahwa T=tT=tT=t hanya bergantung pada ttt tapi tidak menyala θθ\theta. Kemudian,TTT adalah statistik yang …

5
Regresi linier tidak pas
Saya melakukan regresi linier menggunakan fungsi Rm: x = log(errors) plot(x,y) lm.result = lm(formula = y ~ x) abline(lm.result, col="blue") # showing the "fit" in blue tapi itu tidak pas. Sayangnya saya tidak bisa memahami manualnya. Bisakah seseorang mengarahkan saya ke arah yang benar agar lebih cocok? Maksud saya, saya …
9 r  regression 

1
Bingung dengan Penurunan Fungsi Regresi
Saya baru saja mendapat salinan The Elements of Statistics Learning oleh Hastie, Tibshirani, dan Friedman. Dalam bab 2 (Ikhtisar Pembelajaran yang Dibimbing) bagian 4 (Teori Keputusan Statistik), ia memberikan derivasi dari fungsi regresi. Misalkan menunjukkan vektor input acak bernilai nyata, dan variabel output acak bernilai nyata, dengan distribusi gabungan . …


2
Regresi melalui asal
Kami memiliki poin-poin berikut: Bagaimana kita dapat menemukan garis pemasangan terbaik melalui titik-titik? Kalkulator saya memiliki opsi untuk menemukan jalur pemasangan terbaik melalui titik-titik ini, yaitu:( 0 , 0 ) ( 1 , 51.8 ) ( 1.9 , 101.3 ) ( 2.8 , 148.4 ) ( 3.7 , 201.5 ) …


1
Distribusi Posterior untuk Regresi Linier Bayesian
Saya telah meneliti penggunaan regresi linier Bayesian, tetapi saya telah sampai pada contoh yang saya bingung. Diberikan model: y=βX+ϵy=βX+ϵ{\bf y} = {\bf \beta}{\bf X} + \bf{\epsilon} Anggap saja dan ,ϵ∼N(0,ϕI)ϵ∼N(0,ϕI){\bf \epsilon} \sim N(0, \phi I)p(β,ϕ)∝1ϕp(β,ϕ)∝1ϕp(\beta, \phi) \propto \frac{1}{\phi} Bagaimana cara mencapai ?p(β|ϕ,y)p(β|ϕ,y)p(\beta|\phi, {\bf y}) Di mana: .p(β|ϕ,y)∼N(XTX)−1XTy,ϕ(XTX)−1)p(β|ϕ,y)∼N(XTX)−1XTy,ϕ(XTX)−1)p(\beta|\phi, {\bf y}) \sim …

1
Apa yang harus dilakukan dengan heterogenitas varians ketika spread berkurang dengan nilai yang lebih besar
Saya mencoba untuk menghasilkan model campuran linier kode R adalah sebagai berikut. lme (Average.payoff ~ Game + Type + Others.Type + Game: Type + Game: Others.Type + Type: Others.Type, random = ~ 1 | Subjek, metode = "REML", data = Subjectsm1) -> lme1 Istilah respons Average.payoff kontinu sementara semua variabel …

2
Statistik PRESS untuk regresi ridge
Dalam kuadrat terkecil biasa, regresi vektor target terhadap seperangkat prediktor , matriks topi dihitung sebagaiyyyXXX H=X(XtX)−1XtH=X(XtX)−1XtH = X (X^tX)^{-1} X^t dan PRESS (prediksi jumlah residu kuadrat) dihitung oleh SSP=∑i(ei1−hii)2SSP=∑i(ei1−hii)2SS_P = \sum_i \left( \frac{e_i}{1-h_{ii}}\right)^2 di mana adalah residu ke- dan adalah elemen diagonal dari matriks topi.eieie_iiiihiihiih_{ii} Dalam regresi ridge dengan koefisien …

3
Bisakah saya menggunakan variabel yang memiliki hubungan non-linear dengan variabel dependen dalam regresi logistik?
Katakanlah saya sedang membangun model regresi logistik di mana variabel dependen adalah biner dan dapat mengambil nilai atau . Biarkan variabel independen menjadi - ada variabel independen . Katakanlah untuk variabel independen ke- , analisis bivariat menunjukkan tren berbentuk-U - yaitu, jika saya mengelompokkan ke dalam tong yang masing-masing berisi …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.