Menggunakan regresi poisson untuk data kontinu?


11

Dapatkah distribusi poisson digunakan untuk menganalisis data kontinu serta data diskrit?

Saya memiliki beberapa set data di mana variabel respon kontinu, tetapi lebih menyerupai distribusi poisson daripada distribusi normal. Namun, distribusi poisson adalah distribusi diskrit dan biasanya berkaitan dengan angka atau jumlah.


Bagaimana perbedaan distribusi empiris Anda dari varian Gamma?
whuber

1
Saya telah menggunakan distribusi gamma untuk data ini. Jika Anda menggunakan distribusi gamma dengan tautan log, Anda mendapatkan hasil yang hampir sama persis dengan yang Anda dapatkan dari model poisson yang terlalu tersebar. Namun, di sebagian besar paket statistik yang saya kenal dengan regresi poisson lebih sederhana dan jauh lebih fleksibel.
user3136

Tidakkah akan ada distribusi lain yang lebih baik, misalnya saran whuber tentang gamma?
Peter Flom - Pasang kembali Monica

1
@PeterFlom - Saya ingin tahu apakah masalah ini banyak muncul karena paket glmnet di R tidak mendukung keluarga Gamma atau keluarga Gaussian dengan fungsi tautan log. Namun, karena glmnet digunakan sebagai paket pemodelan prediktif (maka pengguna hanya tertarik pada koefisien model, bukan kesalahan. Stnd) dan karena Poisson dbn menghasilkan koefisien yang konsisten. perkiraan untuk model bentuk ln [E (y)] = beta0 + beta * X dengan tanggapan terus menerus terlepas dari distribusinya, saya menduga penulis glmnet tidak repot-repot memasukkan keluarga tambahan ini.
RobertF

Jawaban:


12

Asumsi kunci dari model linier umum yang relevan di sini adalah hubungan antara varians dan rata-rata respons, mengingat nilai-nilai prediktor. Ketika Anda menentukan distribusi Poisson, apa ini berarti adalah bahwa Anda mengasumsikan varians bersyarat adalah sama dengan rata-rata kondisional * sebenarnya. Bentuk dari distribusi tidak peduli sebanyak: bisa Poisson, atau gamma, atau normal, atau apapun selama hubungan mean-variance berlaku.

* Anda dapat mengendurkan asumsi bahwa varians sama dengan mean untuk proporsionalitas, dan biasanya masih mendapatkan hasil yang baik.


9

Jika Anda berbicara tentang menggunakan respons Poisson dalam model linier umum, maka ya, jika Anda bersedia membuat asumsi bahwa varian dari setiap pengamatan sama dengan rata-ratanya.

Jika Anda tidak ingin melakukan itu, alternatif lain mungkin mengubah respons (misalnya, ambil log).


Saya pikir, selain poin Anda, bahkan jika @ user3136 tidak mau membuat asumsi mean = varians, ia dapat menggunakan quasipoissonkeluarga glm.
suncoolsu

2
Tapi masalah saya adalah mengapa Anda ingin mengubah data kontinu menjadi diskrit. Ini pada dasarnya kehilangan informasi. Juga ketika sebuah logtransformasi sederhana akan berhasil, mengapa diskritkan data Anda? Menggunakan glmkarya, tetapi setiap hasil berbasis asimptotik (yang mungkin atau mungkin tidak berlaku)
suncoolsu

@suncoolsu: 1) quasipoisson membuat asumsi rata-rata sebanding dengan varian. 2) Saya tidak bermaksud mentransformasikan ke diskrit, maksud saya mentransformasikan (menjaga kontinuitas) sehingga Anda dapat menggunakan model yang berbeda.
Simon Byrne

ya - saya mengerti setuju dengan Anda. Maaf, saya sedang berbicara tentang pertanyaan itu. Quasi-poisson, memperhitungkan overdisperson kan? (jika saya ingat dengan benar, cf Faraway 2006)
suncoolsu

Dalam contoh khusus ini saya tidak puas bahwa setiap transformasi yang saya coba (log, sqrt, box-cox) memberikan perkiraan yang baik untuk normalitas. Kebetulan, jika saya menggunakan metode transformasi skor normal maka saya dapat mengubah sebagian besar data ke normalitas yang hampir indah, tapi saya belum melihat transformasi ini banyak digunakan jadi saya berasumsi ada tangkapan (sulit untuk kembali-transformasi).
user3136
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.