Pertanyaan yang diberi tag «regression»

Teknik untuk menganalisis hubungan antara satu (atau lebih) variabel "tergantung" dan variabel "independen".

4
(Mengapa) apakah model overfitted cenderung memiliki koefisien yang besar?
Saya membayangkan bahwa semakin besar koefisien pada suatu variabel, semakin besar kemampuan model untuk "berayun" dalam dimensi itu, memberikan peluang yang lebih besar untuk menyesuaikan kebisingan. Meskipun saya pikir saya punya perasaan yang wajar tentang hubungan antara varians dalam model dan koefisien besar, saya tidak memiliki alasan yang baik mengapa …

2
Derajat kebebasan
Statistik uji untuk uji Hosmer-Lemeshow (HLT) untuk goodness of fit (GOF) dari model regresi logistik didefinisikan sebagai berikut: Sampel kemudian dibagi menjadi d=10d=10d=10 desil, D1,D2,…,DdD1,D2,…,DdD_1, D_2, \dots , D_{d} , per desil menghitung jumlah berikut: O1d=∑i∈DdyiO1d=∑i∈DdyiO_{1d}=\displaystyle \sum_{i \in D_d} y_i , yaitu jumlah diamati dari kasus positif di desilDdDdD_d ; …


1
Apakah regresi dengan regularisasi L1 sama dengan Lasso, dan dengan regularisasi L2 sama dengan regresi ridge? Dan bagaimana cara menulis "Lasso"?
Saya seorang insinyur pembelajaran perangkat lunak mesin pembelajaran, terutama melalui kursus pembelajaran mesin Andrew Ng . Saat mempelajari regresi linier dengan regularisasi , saya menemukan istilah yang membingungkan: Regresi dengan regularisasi L1 atau regularisasi L2 LASO Regresi punggungan Jadi pertanyaan saya: Apakah regresi dengan regularisasi L1 persis sama dengan LASSO? …

2
Memahami bentuk dan perhitungan pita kepercayaan dalam regresi linier
Saya mencoba memahami asal-usul bentuk pita kepercayaan melengkung yang terkait dengan regresi linier OLS dan bagaimana hubungannya dengan interval kepercayaan parameter regresi (kemiringan dan intersep), misalnya (menggunakan R): require(visreg) fit <- lm(Ozone ~ Solar.R,data=airquality) visreg(fit) Tampak bahwa pita terkait dengan batas garis yang dihitung dengan intersep 2,5%, dan kemiringan 97,5%, …


4
Mengapa menggunakan regularisasi dalam regresi polinomial daripada menurunkan derajat?
Ketika melakukan regresi, misalnya, dua parameter hiper untuk memilih seringkali adalah kapasitas fungsi (mis. Eksponen terbesar polinomial), dan jumlah regularisasi. Yang saya bingung, mengapa tidak hanya memilih fungsi kapasitas rendah, dan kemudian mengabaikan regularisasi? Dengan begitu, itu tidak akan overfit. Jika saya memiliki fungsi kapasitas tinggi bersama dengan regularisasi, bukankah …


1
Mengapa R mengembalikan NA sebagai koefisien lm ()?
Saya menyesuaikan lm()model ke set data yang mencakup indikator untuk kuartal keuangan (Q1, Q2, Q3, menjadikan Q4 sebagai default). Menggunakan lm(Y~., data = data) Saya mendapatkan NAsebagai koefisien untuk Q3, dan peringatan bahwa satu variabel dikeluarkan karena singularitas. Apakah saya perlu menambahkan kolom Q4?
32 r  regression 


2
Fungsi biaya dalam regresi linier OLS
Saya agak bingung dengan kuliah tentang regresi linier yang diberikan oleh Andrew Ng pada Coursera tentang pembelajaran mesin. Di sana, ia memberikan fungsi biaya yang meminimalkan jumlah kuadrat sebagai: 12 m∑i = 1m( hθ( X( i )) - Y( i ))212m∑saya=1m(hθ(X(saya))-Y(saya))2 \frac{1}{2m} \sum _{i=1}^m \left(h_\theta(X^{(i)})-Y^{(i)}\right)^2 Saya mengerti dari mana berasal. …

1
Apa perbedaan antara "koefisien determinasi" dan "mean squared error"?
Untuk masalah regresi, saya telah melihat orang menggunakan "koefisien determinasi" (alias R kuadrat) untuk melakukan pemilihan model, misalnya, menemukan koefisien penalti yang tepat untuk regularisasi. Namun, itu juga umum untuk menggunakan "mean squared error" atau "root mean squared error" sebagai ukuran akurasi regresi. Jadi apa perbedaan utama antara keduanya? Bisakah …


2
Regresi Logistik: Scikit Learn vs Statsmodels
Saya mencoba memahami mengapa output dari regresi logistik kedua perpustakaan ini memberikan hasil yang berbeda. Saya menggunakan dataset dari tutorial idre UCLA , memprediksi admitberdasarkan gre, gpadan rank. rankdiperlakukan sebagai variabel kategori, jadi pertama-tama dikonversi ke variabel dummy dengan rank_1dijatuhkan. Kolom intersep juga ditambahkan. df = pd.read_csv("https://stats.idre.ucla.edu/stat/data/binary.csv") y, X = …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.