Interval kepercayaan untuk model GAM


14

Membaca mgcv::gamhalaman bantuan:

Interval kepercayaan / kredibel sudah tersedia untuk setiap kuantitas yang diprediksi menggunakan model pas

Namun saya tidak dapat menemukan cara untuk benar-benar mendapatkannya. Saya pikir predict.gamakan memiliki type=confidencedan levelparameter tetapi tidak. Bisakah Anda membantu saya tentang cara membuatnya?

Jawaban:


33

Dengan cara biasa:

p <- predict(mod, newdata, type = "link", se.fit = TRUE)

Kemudian catat yang pberisi komponen $se.fitdengan kesalahan standar prediksi untuk pengamatan di newdata. Anda kemudian dapat membentuk CI dengan mengalikan SE dengan nilai yang sesuai dengan tingkat yang Anda inginkan. Misalnya, perkiraan interval kepercayaan 95% dibentuk sebagai:

upr <- p$fit + (2 * p$se.fit)
lwr <- p$fit - (2 * p$se.fit)

t

Perhatikan bahwa saya menggunakan type = "link"karena Anda tidak mengatakan apakah Anda memiliki GAM atau hanya seorang AM. Dalam GAM, Anda perlu membentuk interval kepercayaan pada skala prediktor linier dan kemudian mengubahnya menjadi skala respons dengan menerapkan kebalikan dari fungsi tautan:

upr <- mod$family$linkinv(upr)
lwr <- mod$family$linkinv(lwr)

Sekarang perhatikan bahwa ini adalah interval yang sangat perkiraan. Selain itu, interval ini adalah titik-bijaksana pada nilai - nilai yang diprediksi dan mereka tidak memperhitungkan fakta bahwa pemilihan kelancaran dilakukan.

Interval kepercayaan simultan dapat dihitung melalui simulasi dari distribusi posterior parameter. Saya punya contoh di blog saya .

Jika Anda menginginkan interval kepercayaan yang tidak tergantung pada parameter smoothing (yaitu yang memperhitungkan yang tidak kita ketahui, melainkan memperkirakan, nilai-nilai parameter smoothness), kemudian tambahkan unconditional = TRUEke predict()panggilan.

Juga, jika Anda tidak ingin melakukan ini sendiri, perhatikan bahwa versi yang lebih baru dari mgcv memiliki plot.gam()fungsi yang mengembalikan objek dengan semua data yang digunakan untuk membuat plot smooths dan interval kepercayaannya. Anda bisa menyimpan output dari plot.gam()dalam obj

obj <- plot(model, ....)

dan kemudian periksa obj, yang merupakan daftar dengan satu komponen per halus. Tambahkan seWithMean = TRUEke plot()panggilan untuk mendapatkan interval kepercayaan yang tidak tergantung pada parameter kelancaran.


Melakukan CI simultan dan bootstrap parametrik sedikit lebih terlibat dengan kode jadi jika Anda bisa bertahan hanya dengan interval pointwise hebat. Jika tidak, saya bisa memberikan contoh lebih lanjut untuk masing-masing.
Pasang kembali Monica - G. Simpson

+1 untuk jawabannya. Posting blog yang mengesankan memang, saya akan mempelajarinya sebentar untuk meningkatkan keterampilan grafis saya.
jbowman

Bagaimana saya bisa mendapatkan akses ke posting blog yang mengesankan itu ( ucfagls.wordpress.com/2011/06/12/12/... )? Saat ini blog membutuhkan login.
geneorama

@geneorama Saya memindahkan blog saya dari Wordpress dan selama setahun dibayar untuk pengalihan ke yang baru untuk semua URL, tetapi saya membiarkan selang itu baru-baru ini. Maaf soal itu. Saya telah mengedit di tautan baru, dan itu tidak memerlukan login. (Login adalah untuk menghindari dua salinan dari posting yang sama dan saya sudah terlalu malas untuk menghapus halaman dari situs Wordpress sampai sekarang.)
Reinstate Monica - G. Simpson

Posting blog asli (lihat riwayat sunting Q&A ini) memiliki kelemahan mendasar dalam cara interval simultan dibuat. Tautan dalam versi Jawaban saat ini (per Des 2016) menghitung interval simultan dengan benar.
Pasang kembali Monica - G. Simpson

5

Jika Anda hanya ingin memplotnya, plot.gamfungsi tersebut memiliki shading yang default ke interval kepercayaan menggunakan argumen teduh. Lihat juga gam.vcompuntuk mendapatkan interval.


5

Paket mgcv (lebih baru dari gam) dengan mudah merencanakan interval yang kredibel. Pendekatan Bayesian ini berbeda dari interval kepercayaan, tetapi hasilnya hampir sama, seperti yang ditunjukkan oleh simulasi numerik (lihat makalah oleh Marra dan Wood yang ditautkan dalam mgcv).


2
+1 Hasil utama dari makalah Marra & Wood adalah bahwa mereka mengembangkan pemahaman / penjelasan Nychka tentang alasannya interval kredibel Bayes yang empiris juga memiliki interpretasi / perilaku frequentist yang cukup luar biasa bila dilihat sebagai interval kepercayaan "lintas fungsi". Anda dapat memperlakukan interval dengan cara Bayesian atau sering dan properti cakupan tersirat oleh1-αInterval berlaku, sekitar.
Pasang kembali Monica - G. Simpson
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.