Untuk menambah jawaban yang sudah ada, pita mewakili interval kepercayaan rata-rata, tetapi dari pertanyaan Anda, Anda jelas mencari interval prediksi . Interval prediksi adalah rentang yang jika Anda menggambar satu titik baru titik itu secara teoritis akan terkandung dalam kisaran X% dari waktu (di mana Anda dapat mengatur tingkat X).
library(ggplot2)
set.seed(5)
x <- rnorm(100)
y <- 0.5*x + rt(100,1)
MyD <- data.frame(cbind(x,y))
Kami dapat menghasilkan jenis plot yang sama dengan yang Anda tunjukkan dalam pertanyaan awal Anda dengan interval kepercayaan di sekitar rata-rata garis regresi loess yang dihaluskan (standarnya adalah interval kepercayaan 95%).
ConfiMean <- ggplot(data = MyD, aes(x,y)) + geom_point() + geom_smooth()
ConfiMean
Untuk contoh interval prediksi yang cepat dan kotor, di sini saya membuat interval prediksi menggunakan regresi linier dengan smoothing splines (sehingga tidak harus berupa garis lurus). Dengan data sampel tidak cukup baik, untuk 100 poin hanya 4 yang berada di luar kisaran (dan saya menentukan interval 90% pada fungsi prediksi).
#Now getting prediction intervals from lm using smoothing splines
library(splines)
MyMod <- lm(y ~ ns(x,4), MyD)
MyPreds <- data.frame(predict(MyMod, interval="predict", level = 0.90))
PredInt <- ggplot(data = MyD, aes(x,y)) + geom_point() +
geom_ribbon(data=MyPreds, aes(x=fit,ymin=lwr, ymax=upr), alpha=0.5)
PredInt
Sekarang beberapa catatan lagi. Saya setuju dengan Ladislav bahwa Anda harus mempertimbangkan metode peramalan deret waktu karena Anda memiliki deret berkala sejak tahun 2007 dan jelas dari plot Anda jika Anda melihat keras ada musim (menghubungkan titik-titik akan membuatnya lebih jelas). Untuk ini saya akan menyarankan memeriksa fungsi forecast.stl dalam paket perkiraan di mana Anda dapat memilih jendela musiman dan menyediakan dekomposisi yang kuat dari musiman dan tren menggunakan Loess. Saya menyebutkan metode yang kuat karena data Anda memiliki beberapa lonjakan yang terlihat.
Lebih umum untuk data seri non-waktu saya akan mempertimbangkan metode kuat lainnya jika Anda memiliki data dengan outlier sesekali. Saya tidak tahu cara membuat interval prediksi menggunakan Loess secara langsung, tetapi Anda dapat mempertimbangkan regresi kuantil (tergantung pada seberapa ekstrim interval prediksi yang diperlukan). Kalau tidak, jika Anda hanya ingin menjadi non-linear, Anda dapat mempertimbangkan splines untuk memungkinkan fungsi bervariasi lebih dari x.