Pertanyaan yang diberi tag «regression»

Teknik untuk menganalisis hubungan antara satu (atau lebih) variabel "tergantung" dan variabel "independen".




9
Bagaimana cara menentukan kepercayaan prediksi jaringan saraf?
Untuk mengilustrasikan pertanyaan saya, anggaplah saya memiliki perangkat pelatihan di mana input memiliki tingkat kebisingan tetapi hasilnya tidak, misalnya; # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : [3.0] di sini output adalah …

3
Memahami paradoks Simpson: teladan Andrew Gelman dengan merosotnya pendapatan untuk jenis kelamin dan tinggi badan
Andrew Gelman dalam salah satu posting blognya mengatakan: Saya tidak berpikir kontrafaktual atau hasil potensial diperlukan untuk paradoks Simpson. Saya mengatakan ini karena seseorang dapat mengatur paradoks Simpson dengan variabel yang tidak dapat dimanipulasi, atau manipulasi yang tidak secara langsung menarik. Paradoks Simpson adalah bagian dari masalah yang lebih umum …


3
Mengapa Lars dan Glmnet memberikan solusi berbeda untuk masalah Lasso?
Saya ingin lebih memahami paket R Larsdan Glmnet, yang digunakan untuk menyelesaikan masalah Lasso: (untuk Variabel dan sampel , lihat www.stanford.edu/~hastie/Papers/glmnet.pdf di halaman 3)pm i n( β0β) ∈ Rp + 1[ 12 N∑i = 1N( ysaya- β0- xTsayaβ)2+ λ | | β| |l1]msayan(β0β)∈Rhal+1[12N∑saya=1N(ysaya-β0-xsayaTβ)2+λ||β||l1]min_{(\beta_0 \beta) \in R^{p+1}} \left[\frac{1}{2N}\sum_{i=1}^{N}(y_i-\beta_0-x_i^T\beta)^2 + \lambda||\beta ||_{l_{1}} …

5
Pengambilan Sampel untuk Data yang Tidak Seimbang dalam Regresi
Ada beberapa pertanyaan bagus tentang penanganan data yang tidak seimbang dalam konteks klasifikasi , tetapi saya bertanya-tanya apa yang dilakukan orang untuk sampel regresi. Katakanlah domain masalah sangat sensitif terhadap tanda tetapi hanya agak sensitif terhadap besarnya target. Namun besarnya cukup penting bahwa model harus regresi (target kontinu) bukan klasifikasi …

5
Regresi polinomial mentah atau ortogonal?
Saya ingin mengembalikan variabel ke x , x 2 , ... , x 5 . Haruskah saya melakukan ini menggunakan polinomial mentah atau ortogonal? Saya melihat pertanyaan di situs yang berurusan dengan ini, tetapi saya tidak benar-benar mengerti apa perbedaan antara menggunakannya. yyyx,x2,…,x5x,x2,…,x5x,x^2,\ldots,x^5 Mengapa saya tidak bisa hanya melakukan regresi …

1
Menjatuhkan salah satu kolom saat menggunakan pengkodean satu-panas
Pemahaman saya adalah bahwa dalam pembelajaran mesin itu bisa menjadi masalah jika dataset Anda memiliki fitur yang sangat berkorelasi, karena mereka secara efektif menyandikan informasi yang sama. Baru-baru ini seseorang menunjukkan bahwa ketika Anda melakukan enkode satu-panas pada variabel kategori Anda berakhir dengan fitur yang berkorelasi, jadi Anda harus membuang …

4
Perbedaan antara asumsi yang mendasari korelasi dan uji kemiringan regresi signifikansi
Pertanyaan saya muncul dari diskusi dengan @whuber di komentar pertanyaan yang berbeda . Secara khusus, komentar @whuber adalah sebagai berikut: Salah satu alasan yang mungkin mengejutkan Anda adalah bahwa asumsi yang mendasari uji korelasi dan uji kemiringan regresi berbeda - jadi bahkan ketika kita memahami bahwa korelasi dan kemiringan benar-benar …

1
Dataset Anscombe-like dengan plot kotak dan kumis yang sama (mean / std / median / MAD / min / max)
EDIT: Karena pertanyaan ini telah meningkat, ringkasan: menemukan set data yang bermakna dan dapat ditafsirkan berbeda dengan statistik campuran yang sama (rata-rata, median, midrange dan dispersinya yang terkait, dan regresi). Kuartet Anscombe (lihat Tujuan memvisualisasikan data dimensi tinggi? ) Adalah contoh terkenal dari empat dataset - , dengan rata-rata marginal …

2
Menambahkan bobot pada regresi logistik untuk data yang tidak seimbang
Saya ingin memodelkan regresi logistik dengan data yang tidak seimbang (9: 1). Saya ingin mencoba opsi bobot dalam glmfungsi di R, tapi saya tidak 100% yakin apa fungsinya. Katakanlah variabel output saya c(0,0,0,0,0,0,0,0,0,1). sekarang saya ingin memberi "1" 10 kali lebih berat. jadi saya memberikan argumen bobot weights=c(1,1,1,1,1,1,1,1,1,1,1,10). Ketika saya …

2
Mengapa normalitas residu "hampir tidak penting sama sekali" untuk tujuan memperkirakan garis regresi?
Gelman and Hill (2006) menulis di halaman 46 bahwa: Asumsi regresi yang umumnya paling tidak penting adalah bahwa kesalahan didistribusikan secara normal. Bahkan, untuk tujuan memperkirakan garis regresi (dibandingkan dengan memprediksi titik data individual), asumsi normalitas hampir tidak penting sama sekali. Jadi, berbeda dengan banyak buku teks regresi, kami tidak …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.