Pertanyaan yang diberi tag «generalized-linear-model»

Generalisasi regresi linier yang memungkinkan hubungan nonlinear melalui "fungsi tautan" dan varians respons bergantung pada nilai yang diprediksi. (Jangan bingung dengan "model linier umum" yang memperluas model linier biasa ke struktur kovarians umum dan respons multivarian.)

2
Mengapa GLM berbeda dari LM dengan variabel yang diubah
Sebagaimana dijelaskan dalam handout kursus ini (halaman 1) , model linear dapat ditulis dalam bentuk: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, di mana yyy adalah variabel respon dan xixix_{i} adalah variabel penjelas ithithi^{th} . Seringkali dengan tujuan memenuhi asumsi pengujian, seseorang dapat mengubah variabel …

1
Apakah kemungkinan log dalam GLM telah menjamin konvergensi ke maxima global?
Pertanyaan saya adalah: Apakah model linier umum (GLM) dijamin untuk konvergen ke global maksimum? Jika demikian, mengapa? Lebih lanjut, kendala apa yang ada pada fungsi tautan untuk memastikan kecemburuan? Pemahaman saya tentang GLM adalah bahwa mereka memaksimalkan fungsi kemungkinan sangat nonlinier. Jadi, saya akan membayangkan bahwa ada beberapa maxima lokal …


3
Bagaimana Anda menjelaskan model linear umum kepada orang-orang yang tidak memiliki latar belakang statistik?
Saya selalu kesulitan menjelaskan teknik statistik kepada audiens tanpa latar belakang statistik. Jika saya ingin menjelaskan apa itu GLM untuk audiens seperti itu (tanpa membuang jargon statistik), apa yang akan menjadi cara terbaik atau paling efektif? Saya biasanya menjelaskan GLM dengan tiga bagian - (1) komponen acak yang merupakan variabel …

2
Apakah tes dispersi berlebih di GLM sebenarnya * berguna *?
Fenomena 'over-dispersi' dalam GLM muncul setiap kali kita menggunakan model yang membatasi varians dari variabel respon, dan data menunjukkan varians yang lebih besar daripada pembatasan model. Ini terjadi secara umum ketika pemodelan menghitung data menggunakan Poisson GLM, dan dapat didiagnosis dengan tes yang terkenal. Jika pengujian menunjukkan bahwa ada bukti …


4
Akurasi mesin peningkat gradien menurun karena jumlah iterasi meningkat
Saya bereksperimen dengan algoritma mesin peningkat gradien melalui caretpaket di R. Menggunakan dataset penerimaan perguruan tinggi kecil, saya menjalankan kode berikut: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
Menentukan struktur kovarians: pro dan kontra
Apa manfaat menentukan struktur kovarians dalam GLM (daripada memperlakukan semua entri diagonal dalam matriks kovarians sebagai nol)? Selain mencerminkan apa yang diketahui seseorang dari data, lakukan itu meningkatkan kebaikan fit? meningkatkan akurasi prediksi pada data yang disimpan? izinkan kami untuk memperkirakan tingkat kovarian? Berapa biaya menerapkan struktur kovarian? Melakukannya menambahkan …

3
Bisakah model untuk data non-negatif dengan penggumpalan di nol (Tweedie GLM, GLM nol-inflasi, dll.) Memprediksi nol yang tepat?
Distribusi Tweedie dapat memodelkan data yang miring dengan massa titik pada nol saat parameter halhalp (eksponen dalam hubungan mean-variance) adalah antara 1 dan 2. Demikian pula model nol-meningkat (apakah kontinu atau diskrit) mungkin memiliki sejumlah besar nol. Saya mengalami kesulitan memahami mengapa ketika saya melakukan prediksi atau menghitung nilai yang …

2
Bagaimana menangani kesalahan seperti "Koefisien: 14 tidak didefinisikan karena singularitas" dalam R?
Ketika melakukan GLM dan Anda mendapatkan kesalahan "tidak ditentukan karena singularitas" di output anova, bagaimana cara menangkal kesalahan ini terjadi? Beberapa orang berpendapat bahwa ini disebabkan oleh kolinearitas antara kovariat atau salah satu level tidak ada dalam dataset (lihat: menafsirkan "tidak ditentukan karena singularitas" dalam lm ) Jika saya ingin …

2
Mengapa regresi linier memiliki asumsi pada residual tetapi model linier umum memiliki asumsi pada respon?
Mengapa regresi linier dan Model Umum memiliki asumsi yang tidak konsisten? Dalam regresi linier, kita asumsikan residual berasal dari Gaussian Dalam regresi lain (regresi logistik, regresi racun), kami menganggap respons datang dari beberapa distribusi (binomial, poission dll). Mengapa kadang-kadang berasumsi sisa dan waktu lain menganggap pada respons? Apakah karena kita …

1
Bagaimana efek acak dengan hanya 1 pengamatan mempengaruhi model campuran linier umum?
Saya memiliki satu set data di mana variabel yang ingin saya gunakan sebagai efek acak hanya memiliki satu pengamatan untuk beberapa level. Berdasarkan jawaban atas pertanyaan sebelumnya, saya telah mengumpulkan bahwa, pada prinsipnya, ini baik-baik saja. Bisakah saya memasukkan model campuran dengan subjek yang hanya memiliki 1 observasi? Model penyadapan …

2
GLM: memverifikasi pilihan fungsi distribusi dan tautan
Saya memiliki model linier umum yang mengadopsi fungsi distribusi dan log link Gaussian. Setelah memasang model, saya memeriksa residu: QQ plot, residual vs nilai prediksi, histogram residu (mengakui bahwa kehati-hatian diperlukan). Semuanya terlihat bagus. Ini sepertinya menyarankan (kepada saya) bahwa pilihan distribusi Gaussian cukup masuk akal. Atau, setidaknya, bahwa residu …


2
Apakah menggunakan data jumlah sebagai variabel independen melanggar asumsi GLM?
Saya ingin menggunakan data jumlah sebagai kovariat sambil menyesuaikan model regresi logistik. Pertanyaanku adalah: Apakah saya melanggar asumsi model logistik (dan, lebih umum, dari linier umum) dengan menggunakan variabel integer hitung non-negatif sebagai variabel independen? Saya menemukan banyak referensi dalam literatur tentang panas untuk menggunakan data jumlah sebagai hasil, tetapi …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.