Pertanyaan yang diberi tag «regression»

Teknik untuk menganalisis hubungan antara satu (atau lebih) variabel "tergantung" dan variabel "independen".

2
KKT versus formulasi regresi laso tanpa kendala
Regresi dihukum L1 (alias laso) disajikan dalam dua formulasi. Biarkan dua fungsi objektif menjadi Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1.Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1. Q_1 = \frac{1}{2}||Y - X\beta||_2^2 \\ Q_2 =\frac{1}{2}||Y - X\beta||_2^2 + \lambda ||\beta||_1. Kemudian dua formulasi yang berbeda adalah argminβQ1argminβQ1 \text{argmin}_\beta \; Q_1 tunduk ||β||1≤t,||β||1≤t, ||\beta||_1 \leq t, dan, ekuivalen dengan argminβQ2.argminβQ2. \text{argmin}_\beta \; Q_2. …


3
Bagaimana menafsirkan koefisien regresi ketika respons ditransformasikan oleh root ke-4?
Saya menggunakan 1/4transformasi kekuatan root keempat ( ) pada variabel respons saya, sebagai hasil dari heteroskedastisitas. Tapi sekarang saya tidak yakin bagaimana menafsirkan koefisien regresi saya. Saya berasumsi bahwa saya perlu membawa koefisien ke kekuatan keempat ketika saya melakukan transformasi balik (lihat di bawah hasil regresi). Semua variabel dalam satuan …


1
Menghitung interval prediksi untuk regresi logistik
Saya ingin memahami cara membuat interval prediksi untuk estimasi regresi logistik. Saya disarankan untuk mengikuti prosedur dalam Pemodelan Data Biner Collett , 2nd Ed hal.98-99. Setelah menerapkan prosedur ini dan membandingkannya dengan R predict.glm, saya benar-benar berpikir buku ini menunjukkan prosedur untuk menghitung interval kepercayaan , bukan interval prediksi. Implementasi …

6
Kapan harus menjatuhkan istilah dari model regresi?
Adakah yang bisa menyarankan jika hal berikut ini masuk akal: Saya berurusan dengan model linier biasa dengan 4 prediktor. Saya dalam dua pikiran apakah akan menjatuhkan istilah yang paling tidak signifikan. Nilai- sedikit di atas 0,05. Saya berpendapat mendukung menjatuhkannya di bawah ini: Mengalikan estimasi istilah ini dengan (misalnya) rentang …


2
Apa perbedaan antara regresi binomial dan regresi logistik?
Saya selalu menganggap regresi logistik hanya sebagai kasus khusus regresi binomial di mana fungsi tautan adalah fungsi logistik (alih-alih, katakanlah, fungsi probit). Dari membaca jawaban atas pertanyaan lain yang saya miliki, sepertinya saya mungkin bingung, dan ada perbedaan antara regresi logistik dan regresi binomial dengan tautan logistik. Apa bedanya?

6
Interpretasi output regresi linier sederhana
Saya telah menjalankan regresi linear sederhana log natural dari 2 variabel untuk menentukan apakah mereka berkorelasi. Output saya adalah ini: R^2 = 0.0893 slope = 0.851 p < 0.001 Saya bingung. Melihat nilai R2R2R^2 , saya akan mengatakan bahwa dua variabel tidak berkorelasi, karena sangat dekat dengan 000 . Namun, …

4
Rata-rata nilai korelasi
Katakanlah saya menguji bagaimana variabel Ybergantung pada variabel Xdalam kondisi eksperimental yang berbeda dan mendapatkan grafik berikut: Garis putus-putus pada grafik di atas menunjukkan regresi linier untuk setiap seri data (pengaturan eksperimental) dan angka-angka dalam legenda menunjukkan korelasi Pearson dari setiap seri data. Saya ingin menghitung "korelasi rata-rata" (atau "korelasi …


4
Apa nilai yang benar untuk presisi dan mengingat dalam kasus tepi?
Presisi didefinisikan sebagai: p = true positives / (true positives + false positives) Apakah benar bahwa, sebagai true positivesdan false positivespendekatan 0, presisi mendekati 1? Pertanyaan yang sama untuk diingat: r = true positives / (true positives + false negatives) Saat ini saya sedang menerapkan tes statistik di mana saya …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

5
Kapan Anda bisa menggunakan kriteria berbasis data untuk menentukan model regresi?
Saya pernah mendengar bahwa ketika banyak spesifikasi model regresi (katakanlah, dalam OLS) dianggap sebagai kemungkinan untuk dataset, ini menyebabkan beberapa masalah perbandingan dan nilai-p dan interval kepercayaan tidak lagi dapat diandalkan. Salah satu contoh ekstrem dari hal ini adalah regresi bertahap. Kapan saya bisa menggunakan data itu sendiri untuk membantu …

2
Bagaimana masuk akal untuk melakukan OLS setelah pemilihan variabel LASSO?
Baru-baru ini saya menemukan bahwa dalam literatur ekonometrik terapan, ketika berhadapan dengan masalah pemilihan fitur, tidak jarang melakukan LASSO diikuti oleh regresi OLS menggunakan variabel yang dipilih. Saya bertanya-tanya bagaimana kita memenuhi syarat validitas dari prosedur semacam itu. Apakah ini akan menyebabkan masalah seperti variabel yang dihilangkan? Adakah bukti yang …

2
Plot residual: mengapa plot versus nilai pas, tidak diamati nilai ?
Dalam konteks regresi OLS, saya memahami bahwa plot residual (vs nilai pas) secara konvensional dipandang untuk menguji varians konstan dan menilai spesifikasi model. Mengapa residu diplot terhadap fit, dan bukan nilai ? Apa perbedaan informasinya dengan kedua plot ini?YYY Saya sedang mengerjakan model yang menghasilkan plot sisa berikut: Jadi plot …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.