Pertanyaan saya mengungkapkan pemahaman saya yang buruk tentang regresi Poisson dan GLM secara umum. Berikut beberapa data palsu untuk mengilustrasikan pertanyaan saya:
### some fake data
x=c(1:14)
y=c(0, 1, 2, 3, 1, 4, 9, 18, 23, 31, 20, 25, 37, 45)
Beberapa fungsi khusus untuk mengembalikan psuedo-R2:
### functions of pseudo-R2
psuR2 <- function(null.dev, model.dev) { 1 - (model.dev / null.dev)}
predR2 <- function(actuals, predicted) { 1 - (sum((actuals - predicted)^2)) / sum((actuals - mean(actuals))^2)}
Sesuai empat model: OLS, Gaussian GLM dengan tautan identitas, Poisson GLM dengan tautan log, Poisson GLM dengan tautan identitas
#### OLS MODEL
mdl.ols=lm(y~x)
summary(mdl.ols)
pred.ols = predict(mdl.ols)
summary(mdl.ols)$r.squared
predR2(y, pred.ols)
#### GLM MODEL, family=gaussian(link="identity")
mdl.guass <- glm(y~x, family=gaussian(link="identity"), maxit=500)
summary(mdl.guass)
pred.guass = predict(mdl.guass)
psuR2(mdl.guass$null.deviance, mdl.guass$deviance)
predR2(y, pred.guass)
#### GLM MODEL, family=possion (canonical link)
mdl.poi_log <- glm(y~x, family=poisson(link="log"), maxit=500)
summary(mdl.poi_log)
pred.poi_log= exp(predict(mdl.poi_log)) #transform
psuR2(mdl.poi_log$null.deviance, mdl.poi_log$deviance)
predR2(y, pred.poi_log)
#### GLM MODEL, family=poisson((link="identity")
mdl.poi_id <- glm(y~x, family=poisson(link="identity"), start=c(0.5,0.5), maxit=500)
summary(mdl.poi_id)
pred.poi_id = predict(mdl.poi_id)
psuR2(mdl.poi_id$null.deviance, mdl.poi_id$deviance)
predR2(y, pred.poi_id)
Terakhir, buat prediksi:
#### Plot the Fit
plot(x, y)
lines(x, pred.ols)
lines(x, pred.guass, col="green")
lines(x,pred.poi_log, col="red")
lines(x,pred.poi_id, col="blue")
Saya punya 2 pertanyaan:
Tampaknya koefisien dan prediksi yang keluar dari OLS dan Gaussian GLM dengan tautan identitas persis sama. Apakah ini selalu benar?
Saya sangat terkejut bahwa perkiraan dan prediksi OLS sangat berbeda dari Poisson GLM dengan tautan identitas . Saya pikir kedua metode akan mencoba memperkirakan E (Y | X). Seperti apakah fungsi likelihood ketika saya menggunakan tautan identitas untuk Poisson?