Seorang kolega saya mengirimi saya masalah ini yang tampaknya membuat putaran di internet:
If $3 = 18, 4 = 32, 5 = 50, 6 = 72, 7 = 98$, Then, $10 =$ ?
Jawabannya sepertinya 200.
3*6
4*8
5*10
6*12
7*14
8*16
9*18
10*20=200
Ketika saya melakukan regresi linier di R:
data <- data.frame(a=c(3,4,5,6,7), b=c(18,32,50,72,98))
lm1 <- lm(b~a, data=data)
new.data <- data.frame(a=c(10,20,30))
predict <- predict(lm1, newdata=new.data, interval='prediction')
Saya mendapat:
fit lwr upr
1 154 127.5518 180.4482
2 354 287.0626 420.9374
3 554 444.2602 663.7398
Jadi model linier saya memprediksi .
Ketika saya memplot data itu terlihat linear ... tapi jelas saya berasumsi sesuatu yang tidak benar.
Saya mencoba mempelajari cara terbaik menggunakan model linear dalam R. Apa cara yang tepat untuk menganalisis seri ini? Di mana saya salah?