Pertanyaan yang diberi tag «zero-inflation»

Kelebihan 0 dalam variabel dibandingkan dengan distribusi referensi yang ditentukan. Pendekatan regresi mencakup model tanpa-inflasi dan model rintangan (2-bagian). Untuk data penghitungan, model zero-inflated dan rintangan berdasarkan Poisson atau distribusi binomial negatif adalah umum (ZIP / ZINB dan HP / HNB).

4
Plot diagnostik untuk regresi jumlah
Plot diagnostik apa (dan mungkin tes formal) yang menurut Anda paling informatif untuk regresi di mana hasilnya adalah variabel hitungan? Saya terutama tertarik pada Poisson dan model binomial negatif, serta rekan-rekan nol-inflated dan rintangan masing-masing. Sebagian besar sumber yang saya temukan hanya memplot nilai residual vs nilai tanpa diskusi tentang …

4
Apa perbedaan antara model zero-inflated dan hurdle?
Saya bertanya-tanya apakah ada perbedaan yang jelas antara apa yang disebut sebagai distribusi nol (model) dan apa yang disebut distribusi hurdle-at-zero (model)? Istilah-istilah itu cukup sering muncul dalam literatur dan saya menduga itu tidak sama, tetapi bisakah Anda menjelaskan kepada saya perbedaannya dalam istilah yang sederhana?

3
Contoh: regresi LASSO menggunakan glmnet untuk hasil biner
Saya mulai mencoba-coba penggunaan glmnetdengan LASSO Regression di mana hasil yang saya minati menjadi dikotomis. Saya telah membuat bingkai data mock kecil di bawah ini: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


1
Kapan menggunakan Poisson vs. GLM binomial geometris vs. negatif untuk data jumlah?
Saya mencoba untuk tata letak sendiri pada saat yang tepat itu untuk penggunaan jenis regresi (geometris, Poisson, binomial negatif) dengan data hitung, dalam kerangka GLM (hanya 3 dari 8 distribusi GLM digunakan untuk data count, meskipun sebagian besar dari apa Saya telah membaca pusat di sekitar distribusi binomial dan Poisson …



2
Mengapa tepatnya regresi beta tidak dapat menangani 0s dan 1s dalam variabel respon?
Regresi beta (yaitu GLM dengan distribusi beta dan biasanya fungsi tautan log) sering direkomendasikan untuk menangani respons alias variabel dependen yang mengambil nilai antara 0 dan 1, seperti fraksi, rasio, atau probabilitas: Regresi untuk hasil (rasio atau fraksi) antara 0 dan 1 . Namun, selalu dinyatakan bahwa regresi beta tidak …



3
Bisakah model untuk data non-negatif dengan penggumpalan di nol (Tweedie GLM, GLM nol-inflasi, dll.) Memprediksi nol yang tepat?
Distribusi Tweedie dapat memodelkan data yang miring dengan massa titik pada nol saat parameter halhalp (eksponen dalam hubungan mean-variance) adalah antara 1 dan 2. Demikian pula model nol-meningkat (apakah kontinu atau diskrit) mungkin memiliki sejumlah besar nol. Saya mengalami kesulitan memahami mengapa ketika saya melakukan prediksi atau menghitung nilai yang …

3
Distribusi nol, apa sebenarnya mereka?
Saya berjuang untuk memahami distribusi nol meningkat. Apakah mereka? Apa gunanya? Jika saya memiliki data dengan banyak nol, maka saya bisa memasukkan regresi logistik pertama menghitung probabilitas nol, dan kemudian saya bisa menghapus semua nol, dan kemudian cocok dengan regresi reguler menggunakan pilihan distribusi saya (misalnya poisson). Lalu seseorang mengatakan …

1
Regresi Poisson nol-inflasi
Misalkan independen danY=(Y1,…,Yn)′Y=(Y1,…,Yn)′ \textbf{Y} = (Y_1, \dots, Y_n)' Yi=0Yi=kwith probability pi+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!Yi=0with probability pi+(1−pi)e−λiYi=kwith probability (1−pi)e−λiλik/k!\eqalign{ Y_i = 0 & \text{with probability} \ p_i+(1-p_i)e^{-\lambda_i}\\ Y_i = k & \text{with probability} \ (1-p_i)e^{-\lambda_i} \lambda_{i}^{k}/k! } Juga misalkan parameter dan p = ( p 1 , … , p n ) …

1
Kesulitan menemukan model yang bagus cocok untuk data hitungan dengan efek campuran - ZINB atau yang lainnya?
Saya memiliki satu set data yang sangat kecil tentang kelimpahan lebah soliter yang saya kesulitan analisis. Ini menghitung data, dan hampir semua penghitungan berada dalam satu perawatan dengan sebagian besar nol dalam perawatan lainnya. Ada juga beberapa nilai yang sangat tinggi (masing-masing di dua dari enam situs), sehingga distribusi jumlah …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.