Pertanyaan yang diberi tag «generalized-linear-model»

Generalisasi regresi linier yang memungkinkan hubungan nonlinear melalui "fungsi tautan" dan varians respons bergantung pada nilai yang diprediksi. (Jangan bingung dengan "model linier umum" yang memperluas model linier biasa ke struktur kovarians umum dan respons multivarian.)


1
Keuntungan GLM di simpul terminal pohon regresi?
Jadi saya bermain-main dengan ide menulis algoritma yang menumbuhkan dan memangkas pohon regresi dari data dan kemudian, di terminal node pohon, cocok dengan GLM. Saya sudah mencoba untuk membaca ide tetapi saya tidak bisa menemukan nama yang konsisten untuk teknik ini. Saya sudah membacanya sebagai pohon regresi hibrida (HRT), pohon …


3
Temukan distribusi dan ubah ke distribusi normal
Saya memiliki data yang menggambarkan seberapa sering suatu peristiwa berlangsung selama satu jam ("angka per jam", nph) dan berapa lama acara berlangsung ("durasi dalam detik per jam", dph). Ini adalah data asli: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, 15.3750000002237, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 


2
Apakah ada cara untuk memaksa hubungan antara koefisien dalam regresi logistik?
Saya ingin menentukan model regresi logistik di mana saya memiliki hubungan berikut: E[Yi|Xi]=f(βxi1+β2xi2)E[Yi|Xi]=f(βxi1+β2xi2)E[Y_i|X_i] = f(\beta x_{i1} + \beta^2x_{i2}) dimana fff adalah fungsi invit logit. Apakah ada cara "cepat" untuk melakukan ini dengan fungsi R yang sudah ada atau apakah ada nama untuk model seperti ini? Saya menyadari bahwa saya dapat …

1
Mengukur varians yang dijelaskan untuk Poisson GLM (fungsi log-link)
Saya mencari ukuran yang sesuai dari "varians yang dijelaskan" dari Poisson GLM (menggunakan fungsi log-link). Saya telah menemukan sejumlah sumber daya yang berbeda (baik di situs ini dan di tempat lain) yang membahas sejumlah pseudo- berbedaR2R2R^2 tindakan, tetapi hampir setiap situs menyebutkan langkah-langkah dalam kaitannya dengan fungsi link-logit, dan mereka …


1
Kemungkinan dan perkiraan untuk efek-efek campuran Regresi logistik
Pertama mari kita mensimulasikan beberapa data untuk regresi logistik dengan bagian-bagian tetap dan acak: set.seed(1) n <- 100 x <- runif(n) z <- sample(c(0,1), n, replace=TRUE) b <- rnorm(2) beta <- c(0.4, 0.8) X <- model.matrix(~x) Z <- cbind(z, 1-z) eta <- X%*%beta + Z%*%b pr <- 1/(1+exp(-eta)) y <- …

1
Bagaimana tepatnya jumlah (atau rata-rata) batasan keterpusatan untuk splines (juga wrt gam dari mgcv) dilakukan?
Proses menghasilkan data adalah:y=sin(x+I(d=0))+sin(x+4∗I(d=1))+I(d=0)z2+3I(d=1)z2+N(0,1)y=sin(x+I(d=0))+sin(x+4∗I(d=1))+I(d=0)z2+3I(d=1)z2+N(0,1)y = \text{sin}\Big(x+I(d=0)\Big) + \text{sin}\Big(x+4*I(d=1)\Big) + I(d=0)z^2 + 3I(d=1)z^2 + \mathbb{N}\left(0,1\right) Misalkan menjadi urutan dari ke dengan panjang dan menjadi faktor yang sesuai . Ambil semua kemungkinan kombinasi untuk menghitung : x,zx,zx,z−4−4-4444100100100dddd∈{0,1}d∈{0,1}d\in\{0,1\}x,z,dx,z,dx,z,dyyy Menggunakan B-spline-Basis (tidak terpusat) untuk untuk setiap tingkat tidak akan layak oleh properti-of-unity-properti (baris jumlah …

2
Apa pembenaran untuk diskritisasi variabel kontinu tanpa pengawasan?
Sejumlah sumber menunjukkan bahwa ada banyak konsekuensi negatif dari diskritisasi (kategorisasi) variabel kontinu sebelum analisis statistik (sampel referensi [1] - [4] di bawah). Sebaliknya [5] menunjukkan bahwa beberapa teknik pembelajaran mesin diketahui menghasilkan hasil yang lebih baik ketika variabel kontinyu didiskritisasi (juga mencatat bahwa metode diskritisasi yang diawasi berperforma lebih …

2
Mengapa tidak ada model data hitungan satu kali lipat?
Saya sedang mengerjakan model data hitung nol-naik menggunakan psclpaket. Saya hanya ingin tahu mengapa tidak ada pengembangan model untuk model data hitungan satu kali lipat! Juga mengapa tidak ada pengembangan model data bimodal, katakanlah zero-and-2-inflated! Setelah saya menghasilkan data Poisson satu-inflasi dan menemukan bahwa baik model glmwith family=poissonatau binomial negatif …

2
Mengapa model statistik cocok jika diberi set data yang sangat besar?
Proyek saya saat ini mungkin mengharuskan saya untuk membuat model untuk memprediksi perilaku sekelompok orang tertentu. set data pelatihan hanya berisi 6 variabel (id hanya untuk tujuan identifikasi): id, age, income, gender, job category, monthly spend di mana monthly spendadalah variabel respon. Tetapi dataset pelatihan berisi sekitar 3 juta baris, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


1
Lasso pada Model Regresi Binomial Negatif
Apakah ada yang bisa saya lakukan LASSO dengan Regresi Binomial Negatif pada R? Saya melakukan regresi binomial negatif pada dataset saya karena data terlalu tersebar untuk memaksakan regresi poisson. Sementara itu, saya juga menghadapi beberapa masalah multikolinieritas. Saya sudah mencoba menggunakan glmnetdengan family = poisson, namun data tersebut tidak pas …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.