Saya telah membaca banyak diskusi hebat di situs tersebut mengenai interpretasi interval kepercayaan dan interval prediksi, tetapi satu konsep masih sedikit membingungkan:
Pertimbangkan kerangka OLS dan kami telah memperoleh dipasang Model y = X β . Kami diberi x ∗ dan diminta untuk memprediksi jawabannya. Kami menghitung x * T β dan, sebagai bonus, kami juga menyediakan interval prediksi 95% sekitar prediksi kami, ala Mendapatkan formula untuk batas prediksi dalam model linear . Sebut saja interval prediksi PI ini.
Sekarang, manakah dari yang berikut ini (atau tidak satu pun) yang merupakan interpretasi PI yang benar?
- Untuk khususnya, y ( x ∗ ) terletak di dalam PI dengan probabilitas 95%.
- Jika kita diberikan sejumlah besar s, prosedur ini untuk menghitung PI akan mencakup respons sebenarnya 95% dari waktu.
Dari kata-kata @ung dalam interval prediksi regresi linier , sepertinya yang pertama benar (walaupun saya bisa saja salah menafsirkan.) Interpretasi 1 tampaknya berlawanan dengan intuisi saya (dalam arti bahwa kita menarik kesimpulan Bayesian dari analisis frequentist), tetapi jika itu benar, itu karena kita memprediksi realisasi dari variabel acak vs memperkirakan sebuah parameter ?
(Sunting) Pertanyaan bonus: Misalkan kita tahu apa sebenarnya, yaitu proses menghasilkan data, maka apakah kita dapat berbicara tentang probabilitas mengenai prediksi tertentu, karena kita hanya melihat ϵ ?
Upaya terakhir saya dalam hal ini: kita dapat "secara konseptual membusuk" (menggunakan kata dengan sangat longgar) interval prediksi menjadi dua bagian: (A) interval kepercayaan di sekitar respons rata-rata yang diprediksi, dan (B) kumpulan interval yang hanya kuantil rentang istilah kesalahan. (B) kita dapat membuat pernyataan probabilistik tentang, dengan syarat mengetahui rata-rata prediksi yang sebenarnya, tetapi secara keseluruhan, kita hanya dapat memperlakukan interval prediksi sebagai CI yang sering muncul di sekitar nilai prediksi. Apakah ini agak benar?