Bagaimana cara menghitung interval kepercayaan x-intersep dalam regresi linier?
Asumsi
- Gunakan model regresi sederhana .yi=α+βxi+εi
- Kesalahan memiliki distribusi normal yang tergantung pada regressorϵ|X∼N(0,σ2In)
- Pas menggunakan kuadrat terkecil biasa
3 prosedur untuk menghitung interval kepercayaan pada x-intersep
Urutan pertama ekspansi Taylor
Model Anda dengan perkiraan standar deviasi dan pada dan parameter dan diperkirakan kovarians . Anda memecahkanY=aX+bσaσbabσab
aX+b=0⇔X=−ba.
Kemudian standar deviasi pada diberikan oleh:σXX
(σXX)2=(σbb)2+(σaa)2−2σabab.
MIB
Lihat kode dari Marc di kotak di Bagaimana cara menghitung interval kepercayaan x-intersep dalam regresi linier? .
CAPITANI-POLLASTRI
CAPITANI-POLLASTRI menyediakan Fungsi Distribusi Kumulatif dan Fungsi Kepadatan untuk rasio dua variabel acak Normal berkorelasi. Ini dapat digunakan untuk menghitung interval kepercayaan x-intersep dalam regresi linier. Prosedur ini memberikan (hampir) hasil yang identik dengan yang dari MIB.
Memang, menggunakan kuadrat terkecil biasa dan mengasumsikan normalitas kesalahan, (diverifikasi) dan berkorelasi (terverifikasi).β^∼N(β,σ2(XTX)−1)β^
Prosedurnya adalah sebagai berikut:
- dapatkan penaksir OLS untuk dan .ab
- dapatkan matriks varians-kovarians dan ekstrak, .σa,σb,σab=ρσaσb
- Asumsikan bahwa dan mengikuti distribusi Normal Berkorelasi Bivariat, . Kemudian fungsi kerapatan dan Fungsi Distribusi Kumulatif diberikan oleh CAPITANI-POLLASTRI.abN(a,b,σa,σb,ρ)xintercept=−ba
- Gunakan Fungsi Distribusi Kumulatif untuk menghitung kuantil yang diinginkan dan mengatur interval cofidence.xintercept=−ba
Perbandingan 3 prosedur
Prosedur dibandingkan menggunakan konfigurasi data berikut:
- x <- 1:10
- a <- 20
- b <- -2
- y <- a + b * x + rnorm (panjang (x), rata-rata = 0, sd = 1)
10000 sampel berbeda dihasilkan dan dianalisis menggunakan 3 metode. Kode (R) yang digunakan untuk menghasilkan dan menganalisis dapat ditemukan di: https://github.com/adrienrenaud/stackExchange/blob/master/crossValidated/q221630/answer.ipynb
- MIB dan CAPITANI-POLLASTRI memberikan hasil yang setara.
- Urutan pertama ekspansi Taylor berbeda secara signifikan dari dua metode lainnya.
- MIB dan CAPITANI-POLLASTRI mengalami kekurangan cakupan. 68% (95%) ci ditemukan mengandung nilai sebenarnya 63% (92%) saat itu.
- Ekspansi Taylor urutan pertama mengalami over-coverage. 68% (95%) ci ditemukan mengandung nilai sebenarnya 87% (99%) saat itu.
Kesimpulan
Distribusi x-intersep bersifat asimetris. Ini membenarkan interval kepercayaan asimetris. MIB dan CAPITANI-POLLASTRI memberikan hasil yang setara. CAPITANI-POLLASTRI memiliki justifikasi teori yang bagus dan memberikan dasar bagi MIB. MIB dan CAPITANI-POLLASTRI menderita dari cakupan sedang dan dapat digunakan untuk mengatur interval kepercayaan.
library(boot); sims <- boot(data.frame(x, y), function(d, i) { fit <- lm(y ~ x, data = d[i,]) -coef(fit)[1]/coef(fit)[2] }, R = 1e4); points(quantile(sims$t, c(0.025, 0.975)), c(0, 0))
. Untuk interval prediksi terbalik, file bantuanchemCal:::inverse.predict
memberikan referensi berikut yang mungkin juga membantu menurunkan CI: Massart, LM, Vandenginste, BGM, Buydens, LMC, De Jong, S., Lewi, PJ, Smeyers-Verbeke, J. (1997 ) Buku Pegangan Chemometrics dan Qualimetrics: Bagian A, hlm. 200