Distribusi "default", yang paling umum digunakan dan dijelaskan, untuk data jumlah adalah distribusi Poisson . Paling sering diilustrasikan menggunakan contoh penggunaan praktis pertama:
Aplikasi praktis dari distribusi ini dibuat oleh Ladislaus Bortkiewicz pada tahun 1898 ketika ia diberi tugas untuk menyelidiki jumlah tentara di pasukan Prusia yang terbunuh secara tidak sengaja oleh tendangan kuda; Percobaan ini memperkenalkan distribusi Poisson ke bidang teknik keandalan.
Distribusi poisson ditentukan oleh laju per interval waktu tetap ( juga berarti dan variansnya). Dalam kasus regresi, kita dapat menggunakan distribusi Poisson dalam model linier umum dengan fungsi link-linearλλλ
E( Y| X, β) = λ = exp( β0+ β1X1+ ⋯ + βkXk)
yang disebut regresi Poisson , karena kita dapat mengasumsikan bahwa adalah tingkat distribusi Poisson. Namun perhatikan bahwa untuk regresi log-linier Anda tidak harus membuat asumsi seperti itu dan cukup menggunakan GLM dengan tautan log dengan data yang tidak dihitung. Ketika menafsirkan parameter yang perlu Anda ingat bahwa, karena menggunakan transformasi log, perubahan variabel independen menghasilkan perubahan multiplikatif dalam jumlah yang diprediksi.λ
Masalah dengan menggunakan distribusi Poisson untuk data kehidupan nyata adalah mengasumsikan berarti sama dengan varians. Pelanggaran terhadap asumsi ini disebut overdispersion . Dalam kasus seperti itu Anda selalu dapat menggunakan model kuasi-Poisson , model log-linear non-Poisson (untuk jumlah besar Poisson dapat didekati dengan distribusi normal), regresi binomial negatif (terkait erat dengan Poisson; lihat Berk dan MacDonald, 2008), atau model lain, seperti yang dijelaskan oleh Stephan Kolassa .
Untuk beberapa pengantar yang ramah untuk regresi Poisson Anda juga dapat memeriksa makalah oleh Lavery (2010), atau Coxe, West dan Aiken (2009).
Lavery, R. (2010). Panduan Animasi: Pengantar Regresi Poisson. Kertas NESUG, sa04.
Coxe, S., West, SG, & Aiken, LS (2009). Analisis data jumlah: Pengantar lembut untuk regresi Poisson dan alternatifnya. Jurnal penilaian kepribadian, 91 (2), 121-136.
Berk, R., & MacDonald, JM (2008). Penyebaran berlebihan dan regresi Poisson. Jurnal Kriminologi Kuantitatif, 24 (3), 269-284.