Pertanyaan yang diberi tag «regression»

Teknik untuk menganalisis hubungan antara satu (atau lebih) variabel "tergantung" dan variabel "independen".

1
Bagaimana cara menguji signifikansi statistik untuk variabel kategori dalam regresi linier?
Jika dalam regresi linier saya memiliki variabel kategorikal ... bagaimana saya tahu arti statistik variabel kategoris? Katakanlah faktor memiliki 10 level ... akan ada 10 nilai t-resultan yang berbeda, di bawah payung satu variabel faktor X 1X1X1X_1X1X1X_1 ... Tampaknya bagi saya bahwa makna statistik diuji untuk setiap tingkat variabel faktor? …


2
Apakah ada representasi grafis tradeoff bias-varians dalam regresi linier?
Saya menderita pemadaman. Saya disajikan gambar berikut untuk menunjukkan tradeoff bias-varians dalam konteks regresi linier: Saya dapat melihat bahwa tidak satu pun dari kedua model yang cocok - "sederhana" tidak menghargai kompleksitas hubungan XY dan "kompleks" hanya overfitting, pada dasarnya mempelajari data pelatihan dengan hati. Namun saya benar-benar gagal melihat …

2
Apa cara yang benar untuk menguji perbedaan yang signifikan antara koefisien?
Saya berharap seseorang dapat membantu meluruskan titik kebingungan bagi saya. Katakanlah saya ingin menguji apakah 2 set koefisien regresi secara signifikan berbeda satu sama lain, dengan pengaturan berikut: yi=α+βxi+ϵiyi=α+βxi+ϵiy_i = \alpha + \beta x_i + \epsilon_i , dengan 5 variabel independen. 2 grup, dengan ukuran yang kira-kira sama (meskipun ini …

1
Asumsi LASSO
Dalam skenario regresi LASSO di mana y=Xβ+ϵy=Xβ+ϵy= X \beta + \epsilon , dan perkiraan LASSO diberikan oleh masalah optimisasi berikut minβ||y−Xβ||+τ||β||1minβ||y−Xβ||+τ||β||1 \min_\beta ||y - X \beta|| + \tau||\beta||_1 Apakah ada asumsi distribusi tentang ϵϵ\epsilon ? Dalam skenario OLS, orang akan berharap bahwa ϵϵ\epsilon independen dan terdistribusi normal. Apakah masuk akal …



3
Mengapa tidak menggunakan "persamaan normal" untuk menemukan koefisien kuadrat terkecil sederhana?
Saya melihat daftar ini di sini dan tidak percaya ada begitu banyak cara untuk menyelesaikan kuadrat terkecil. "Persamaan normal" di Wikipedia tampaknya merupakan cara yang cukup lurus ke depan: α^β^=y¯−β^x¯,=∑ni=1(xi−x¯)(yi−y¯)∑ni=1(xi−x¯)2α^=y¯−β^x¯,β^=∑i=1n(xi−x¯)(yi−y¯)∑i=1n(xi−x¯)2 {\displaystyle {\begin{aligned}{\hat {\alpha }}&={\bar {y}}-{\hat {\beta }}\,{\bar {x}},\\{\hat {\beta }}&={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})(y_{i}-{\bar {y}})}{\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}}\end{aligned}}} Jadi mengapa tidak menggunakannya …

1
Apakah ada interpretasi Bayesian tentang regresi linier dengan regularisasi L1 dan L2 simultan (alias jaring elastis)?
Ini juga diketahui bahwa regresi linier dengan penalti setara dengan menemukan perkiraan MAP diberi Gaussian sebelumnya pada koefisien. Demikian pula, menggunakan l 1 penalti setara dengan menggunakan distribusi Laplace sebagai sebelumnya.l2l2l^2l1l1l^1 Tidak jarang menggunakan kombinasi tertimbang dari regularisasi dan l 2 . Bisakah kita mengatakan bahwa ini setara dengan beberapa …

2
Mengapa tepatnya regresi beta tidak dapat menangani 0s dan 1s dalam variabel respon?
Regresi beta (yaitu GLM dengan distribusi beta dan biasanya fungsi tautan log) sering direkomendasikan untuk menangani respons alias variabel dependen yang mengambil nilai antara 0 dan 1, seperti fraksi, rasio, atau probabilitas: Regresi untuk hasil (rasio atau fraksi) antara 0 dan 1 . Namun, selalu dinyatakan bahwa regresi beta tidak …

2
Perbedaan antara analisis regresi dan pemasangan kurva
Adakah yang bisa menjelaskan kepada saya perbedaan nyata antara analisis regresi dan pemasangan kurva (linear dan nonlinier), dengan contoh jika mungkin? Tampaknya keduanya mencoba untuk menemukan hubungan antara dua variabel (dependen vs independen) dan kemudian menentukan parameter (atau koefisien) yang terkait dengan model yang diusulkan. Misalnya, jika saya memiliki satu …

1
Bagaimana cara menghitung interval prediksi untuk LOESS?
Saya memiliki beberapa data yang saya pas menggunakan model LOESS di R, memberi saya ini: Data memiliki satu prediktor dan satu respons, dan bersifat heteroskedastik. Saya juga menambahkan interval kepercayaan. Masalahnya adalah intervalnya adalah interval kepercayaan untuk garis, sedangkan saya tertarik pada interval prediksi. Misalnya, panel bawah lebih bervariasi daripada …

2
Apa yang dijelaskan oleh Plot Variabel Tambahan (Plot Regresi Parsial) dalam suatu regresi berganda?
Saya memiliki model dataset Film dan saya menggunakan regresi: model <- lm(imdbVotes ~ imdbRating + tomatoRating + tomatoUserReviews+ I(genre1 ** 3.0) +I(genre2 ** 2.0)+I(genre3 ** 1.0), data = movies) library(ggplot2) res <- qplot(fitted(model), resid(model)) res+geom_hline(yintercept=0) Yang memberi output: Sekarang saya mencoba mengerjakan sesuatu yang disebut Added Variable Plot pertama kali …

1
Bias variabel yang dihilangkan dalam regresi logistik vs bias variabel yang dihilangkan dalam regresi kuadrat terkecil biasa
Saya punya pertanyaan tentang bias variabel yang dihilangkan dalam regresi logistik dan linier. Katakanlah saya menghilangkan beberapa variabel dari model regresi linier. Berpura-pura bahwa variabel-variabel yang dihilangkan tersebut tidak berkorelasi dengan variabel yang saya sertakan dalam model saya. Variabel-variabel yang dihilangkan tidak bias koefisien dalam model saya. Tetapi dalam regresi …

2
Interpretasi dari regresi logistik ordinal
Saya menjalankan regresi logistik ordinal ini di R: mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars) Saya mendapatkan ringkasan model ini: summary(mtcars_ordinal) Re-fitting to get Hessian Call: polr(formula = as.factor(carb) ~ mpg, data = mtcars) Coefficients: Value Std. Error t value mpg -0.2335 0.06855 -3.406 Intercepts: Value Std. Error t value 1|2 …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.