Pertanyaan yang diberi tag «count-data»

Data jumlah adalah bilangan bulat non-negatif yang mewakili jumlah keseluruhan.

1
Mengapa transformasi akar kuadrat direkomendasikan untuk menghitung data?
Sering disarankan untuk mengambil akar kuadrat ketika Anda memiliki data hitungan. (Untuk beberapa contoh pada CV, lihat jawaban @ HarveyMotulsky di sini , atau jawaban @ whuber di sini .) Di sisi lain, ketika memasang model linear umum dengan variabel respons yang didistribusikan sebagai Poisson, log adalah tautan kanonik . …


1
Metrik galat untuk memvalidasi silang model Poisson
Saya memvalidasi silang model yang mencoba memprediksi hitungan. Jika ini adalah masalah klasifikasi biner, saya akan menghitung AUC out-of-fold, dan jika ini adalah masalah regresi saya akan menghitung RMSE atau MAE out-of-fold Untuk model Poisson, metrik kesalahan apa yang dapat saya gunakan untuk mengevaluasi "keakuratan" dari prediksi out-of-sample? Apakah ada …


2
Diagnostik untuk model linier umum (campuran) (khususnya residu)
Saat ini saya kesulitan menemukan model yang tepat untuk data penghitungan yang sulit (variabel dependen). Saya telah mencoba berbagai model yang berbeda (model efek campuran diperlukan untuk jenis data saya) seperti lmerdan lme4(dengan log transformasi) serta model efek campuran linier umum dengan berbagai keluarga seperti Gaussian atau binomial negatif. Namun, …

2
Generalisasi berkelanjutan dari distribusi binomial negatif
Distribusi binomial negatif (NB) didefinisikan pada bilangan bulat non-negatif dan memiliki fungsi massa probabilitas f(k;r,p)=(k+r−1k)pk(1−p)r.f(k;r,p)=(k+r−1k)pk(1−p)r.f(k;r,p)={\binom {k+r-1}{k}}p^{k}(1-p)^{r}.Apakah masuk akal untuk mempertimbangkan distribusi kontinu pada real non-negatif yang didefinisikan oleh rumus yang sama (mengganti k∈N0k∈N0k\in \mathbb N_0 oleh x∈R≥0x∈R≥0x\in\mathbb R_{\ge 0} )? Koefisien binomial dapat ditulis ulang sebagai produk dari (k+1)⋅…⋅(k+r−1)(k+1)⋅…⋅(k+r−1)(k+1)\cdot\ldots\cdot(k+r-1) , …



1
Kapan menggunakan Poisson vs. GLM binomial geometris vs. negatif untuk data jumlah?
Saya mencoba untuk tata letak sendiri pada saat yang tepat itu untuk penggunaan jenis regresi (geometris, Poisson, binomial negatif) dengan data hitung, dalam kerangka GLM (hanya 3 dari 8 distribusi GLM digunakan untuk data count, meskipun sebagian besar dari apa Saya telah membaca pusat di sekitar distribusi binomial dan Poisson …

1
Mendeteksi pencilan dalam data hitungan
Saya memiliki apa yang saya anggap naif sebagai masalah yang cukup lurus ke depan yang melibatkan deteksi outlier untuk banyak set data penghitungan yang berbeda. Secara khusus, saya ingin menentukan apakah satu atau lebih nilai dalam serangkaian data jumlah lebih tinggi atau lebih rendah dari yang diharapkan relatif terhadap sisa …


2
Poisson atau quasi poisson dalam regresi dengan jumlah data dan penyebaran berlebihan?
Saya memiliki data jumlah (analisis permintaan / penawaran dengan menghitung jumlah pelanggan, tergantung pada - kemungkinan - banyak faktor). Saya mencoba regresi linier dengan kesalahan normal, tetapi plot QQ saya tidak terlalu bagus. Saya mencoba transformasi log dari jawabannya: sekali lagi, plot QQ buruk. Jadi sekarang, saya mencoba regresi dengan …

1
signifikansi perbedaan antara dua hal
Apakah ada cara untuk menentukan apakah perbedaan antara jumlah kecelakaan di jalan pada waktu 1 berbeda secara signifikan dengan hitungan pada waktu 2? Saya telah menemukan metode yang berbeda untuk menentukan perbedaan antara kelompok pengamatan pada waktu yang berbeda (misalnya membandingkan cara poisson) tetapi tidak untuk membandingkan hanya dua hitungan. …

2
Apakah menggunakan data jumlah sebagai variabel independen melanggar asumsi GLM?
Saya ingin menggunakan data jumlah sebagai kovariat sambil menyesuaikan model regresi logistik. Pertanyaanku adalah: Apakah saya melanggar asumsi model logistik (dan, lebih umum, dari linier umum) dengan menggunakan variabel integer hitung non-negatif sebagai variabel independen? Saya menemukan banyak referensi dalam literatur tentang panas untuk menggunakan data jumlah sebagai hasil, tetapi …

2
Kesalahan standar suatu hitungan
Saya memiliki dataset kasus insiden berdasarkan musim penyakit langka. Misalnya, ada 180 kasus di musim semi, 90 di musim panas, 45 di musim gugur, dan 210 di musim dingin. Saya bergumul dengan apakah pantas untuk melampirkan kesalahan standar pada angka-angka ini. Tujuan penelitian dapat disimpulkan dalam arti bahwa kita mencari …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.