Pertanyaan yang diberi tag «regression»

Teknik untuk menganalisis hubungan antara satu (atau lebih) variabel "tergantung" dan variabel "independen".

1
Apa perbedaan antara AIC () dan extractAIC () dalam R?
Dokumentasi R untuk keduanya tidak menjelaskan banyak hal. Semua yang bisa saya dapatkan dari tautan ini adalah bahwa menggunakan salah satu dari keduanya harus baik-baik saja. Yang tidak saya dapatkan adalah mengapa mereka tidak sama. Fakta: Fungsi regresi bertahap di R, step()menggunakan extractAIC(). Menariknya, menjalankan lm()model dan model glm()'null' (hanya …

2
Mengapa model "kesalahan dalam X" tidak banyak digunakan?
Ketika kita menghitung standard error dari koefisien regresi, kita tidak memperhitungkan keacakan dalam desain matriks XXX . Dalam OLS misalnya, kita menghitung var(β^)var(β^)\text{var}(\hat{\beta}) sebagai var((XTX)−1XTY)=σ2(XTX)−1var((XTX)-1XTY)=σ2(XTX)-1\text{var}((X^TX)^{-1}X^TY) = \sigma^2(X^TX)^{-1} Jika XXX dianggap acak, hukum varians total akan, dalam arti tertentu, menuntut kontribusi tambahan dari varian XXX juga. yaitu var(β^)=var(E(β^|X))+E(var(β^|X)).var(β^)=var(E(β^|X))+E(var(β^|X)).\text{var}(\hat{\beta}) = \text{var}(E(\hat{\beta}|X)) + …


3
Dapatkah regresi linier menjadi signifikan jika data tidak linier?
Saya melakukan regresi linier yang keluar dengan hasil yang signifikan namun ketika saya memeriksa plot-scatter untuk linearitas saya tidak yakin bahwa data itu linear. Apakah ada cara lain untuk menguji linearitas tanpa memeriksa scatterplot? Bisakah regresi linier menjadi signifikan jika tidak linier? [Diedit untuk memasukkan scatterplots]
11 regression 

2
Memahami bentuk interval kepercayaan untuk regresi polinomial (MLR)
Saya mengalami kesulitan untuk memahami bentuk interval kepercayaan dari regresi polinomial. Ini adalah contoh buatan, . Gambar kiri menggambarkan UPV (varians prediksi tidak berskala) dan grafik kanan menunjukkan interval kepercayaan dan (diukur) titik yang diukur pada X = 1,5, X = 2 dan X = 3.Y^=a+b⋅X+c⋅X2Y^=a+b⋅X+c⋅X2\hat{Y}=a+b\cdot X+c\cdot X^2 Detail data …

1
Haruskah derajat koreksi kebebasan digunakan untuk inferensi pada parameter GLM?
Pertanyaan ini terinspirasi oleh jawaban Martijn di sini . Misalkan kita cocok GLM untuk satu keluarga parameter seperti model binomial atau Poisson dan itu adalah prosedur kemungkinan penuh (sebagai lawan mengatakan, quasipoisson). Kemudian, varians adalah fungsi dari mean. Dengan binomial: dan dengan Poisson .var [ X ] = E [ …


2
Mengapa tabel anova regresi ini identik?
Saya memiliki dua regresi dari Y yang sama dan tiga tingkat X. Secara keseluruhan n = 15, dengan n = 5 di setiap kelompok atau tingkat X. Regresi pertama memperlakukan X sebagai kategori, menetapkan variabel indikator ke level 2 dan 3 dengan level satu menjadi rujukan. Indikator / boneka seperti: …
11 regression  anova 

4
Mengapa metode Least-Squares dan Maximum-Likelihood tidak setara ketika kesalahan tidak terdistribusi secara normal?
Judul mengatakan itu semua. Saya mengerti bahwa Least-Squares dan Maximum-Likelihood akan memberikan hasil yang sama untuk koefisien regresi jika kesalahan model terdistribusi secara normal. Tetapi, apa yang terjadi jika kesalahan tidak terdistribusi secara normal? Mengapa kedua metode ini tidak lagi setara?


2
Apakah membagi data menjadi set tes dan pelatihan semata-mata merupakan "statistik"?
Saya seorang mahasiswa fisika yang mempelajari pembelajaran mesin / ilmu data, jadi saya tidak bermaksud pertanyaan ini untuk memulai konflik apa pun :) Namun, sebagian besar program sarjana fisika adalah melakukan laboratorium / eksperimen, yang berarti banyak data pemrosesan dan analisis statistik. Namun, saya melihat perbedaan yang tajam antara cara …

1
Bagaimana menafsirkan hasil ketika ridge dan laso secara terpisah berkinerja baik tetapi menghasilkan koefisien yang berbeda
Saya menjalankan model regresi baik dengan Lasso dan Ridge (untuk memprediksi variabel hasil diskrit mulai dari 0-5). Sebelum menjalankan model, saya menggunakan SelectKBestmetode scikit-learnuntuk mengurangi set fitur dari 250 menjadi 25 . Tanpa pemilihan fitur awal, Lasso dan Ridge menghasilkan skor akurasi yang lebih rendah [yang mungkin disebabkan oleh ukuran …

2
Jika Anda tidak dapat melakukannya secara orthogonal, lakukan mentah (regresi polinomial)
Saat melakukan regresi polinomial untuk ke , orang terkadang menggunakan polinomial mentah, terkadang polinomial ortogonal. Tetapi ketika mereka menggunakan apa yang tampaknya sepenuhnya sewenang-wenang.XYYYXXX Di sini dan di sini polinomial mentah digunakan. Tetapi di sini dan di sini , polinomial ortogonal tampaknya memberikan hasil yang benar. Apa, bagaimana, mengapa ?! …

2
Jika susut diterapkan dengan cara yang cerdas, apakah itu selalu bekerja lebih baik untuk penduga yang lebih efisien?
Misalkan saya memiliki dua estimator dan yang merupakan estimator konsisten dari parameter yang sama dan sedemikian rupa sehingga dengan dalam arti psd. Dengan demikian, asymptotically lebih efisien daripada . Kedua penaksir ini didasarkan pada fungsi kerugian yang berbeda. β 2β0√βˆ1β^1\widehat{\beta}_1βˆ2β^2\widehat{\beta}_2β0β0\beta_0V1≤V2 β 1 β 2n−−√(βˆ1−β0)→dN(0,V1),n−−√(βˆ2−β0)→dN(0,V2)n(β^1−β0)→dN(0,V1),n(β^2−β0)→dN(0,V2)\sqrt{n}(\widehat{\beta}_1 -\beta_0) \stackrel{d}\rightarrow \mathcal{N}(0, V_1), \quad \sqrt{n}(\widehat{\beta}_2 …

3
Regresi dengan data miring
Mencoba menghitung jumlah kunjungan dari demografi dan layanan. Data sangat miring. Histogram: plot qq (kiri adalah log): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) citydan servicemerupakan variabel faktor. Saya mendapatkan nilai p rendah *** untuk semua variabel, tapi saya juga mendapatkan r-kuadrat rendah 0,05. Apa yang harus saya lakukan? Apakah model …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.