Offset waktu biasanya dapat dilihat sebagai model Anda memperkirakan tingkat suatu peristiwa terjadi per unit waktu, dengan offset mengendalikan berapa lama Anda mengamati subjek yang berbeda.
Dalam model poisson Anda selalu memperkirakan tingkat bahwa sesuatu terjadi, tetapi Anda tidak pernah bisa mengamati tingkat ini secara langsung. Anda tidak bisa mengamati berapa kali suatu peristiwa terjadi selama beberapa jumlah waktu. Offset membuat hubungan antara dua konsep.
Misalnya, Anda mengamati subjek yang menembak keranjang untuk jumlah waktu yang bervariasi, dan Anda menghitung jumlah keranjang yang berhasil untuk setiap subjek. Apa yang benar-benar Anda minati adalah seberapa sering setiap subjek menenggelamkan sebuah keranjang, yaitu jumlah keranjang yang berhasil setiap subjek harapkan akan tenggelam setiap menit, karena itu merupakan ukuran keterampilan mereka yang agak objektif. Jumlah keranjang yang benar-benar Anda amati tenggelam akan menjadi perkiraan laju ini berapa lama Anda mengamati subjek yang berusaha. Jadi Anda dapat berpikir dalam hal unit respon, jumlah keranjang per menit .
Sulit untuk memikirkan situasi di mana Anda akan menggunakan waktu yang diamati sebagai kovariat dalam regresi poisson, karena pada dasarnya Anda memperkirakan nilai.
Misalnya, jika saya ingin menilai efek menjadi orang Amerika vs Eropa (contoh sangat konyol) pada jumlah keranjang, menambahkan waktu sebagai kovariat akan memungkinkan saya untuk menilai efek itu "secara mandiri" dari waktu berlalu menembak, bukankah Itu? Lebih jauh lagi itu juga akan memberi saya perkiraan pengaruh waktu terhadap hasilnya.
Inilah contoh yang mudah-mudahan menyoroti bahaya ini. Asumsikan bahwa orang Amerika dan Eropa, pada kenyataannya, menenggelamkan jumlah keranjang yang sama setiap menit. Tetapi katakan bahwa kita telah mengamati setiap orang Eropa dua kali lebih lama dari setiap orang Amerika, jadi, rata-rata, kita telah mengamati keranjang dua kali lebih banyak untuk setiap orang Eropa.
Jika kita mengatur model termasuk parameter untuk kedua kalinya diamati dan indikator untuk "adalah Eropa", maka kedua model ini menjelaskan data:
E( keranjang ) = 2 c t + 0 xEropean
E( keranjang ) = 0 t + 2 c xEropean
c
Sebagai ahli statistik, kami benar-benar ingin, dalam situasi ini, model kami untuk memberi tahu kami bahwa tidak ada perbedaan statistik antara tingkat yang dibuat orang Eropa dengan keranjang dan tingkat orang Amerika yang membuat keranjang. Tapi model kami gagal melakukannya, dan kami bingung.
Masalahnya adalah kita tahu sesuatu yang tidak diketahui model kita . Yaitu, kita tahu bahwa jika kita mengamati individu yang sama untuk dua kali lebih banyak waktu, bahwa, dengan harapan, mereka akan membuat keranjang dua kali lebih banyak. Karena kita tahu ini, kita perlu memberi tahu model kita tentang hal itu. Inilah yang dicapai offset.
Mungkin menggunakan metode offset tepat ketika kita tahu bahwa peristiwa terjadi secara seragam sepanjang waktu!
Ya, tapi ini asumsi model poisson itu sendiri . Dari halaman wikipedia pada distribusi poisson
distribusi Poisson, dinamai berdasarkan matematikawan Prancis Siméon Denis Poisson, adalah distribusi probabilitas diskrit yang menyatakan probabilitas sejumlah peristiwa tertentu yang terjadi dalam interval waktu dan / atau ruang yang tetap jika peristiwa ini terjadi dengan laju rata-rata yang diketahui dan tidak tergantung pada waktu sejak acara terakhir .