Dengan alasan yang sama seperti di sini , saya mungkin dapat memberikan jawaban untuk pertanyaan Anda dalam kondisi tertentu.
Biarkan menjadi nilai Anda yang sebenarnya untuk titik data dan nilai estimasi. Jika kita mengasumsikan bahwa perbedaan antara nilai estimasi dan nilai sebenarnya memiliki i t h x ixiithx^i
berarti nol (yaitu didistribusikan di sekitar )xix^ixi
ikuti distribusi normal
dan semua memiliki standar deviasi yang samaσ
pendeknya:
x^i−xi∼N(0,σ2),
maka Anda benar-benar menginginkan interval kepercayaan untuk .σ
Jika asumsi di atas tetap benar
mengikuti dengan (bukan ) derajat kebebasan. Ini berarti χ 2 n nn n-1
n RMSE2σ2= n 1n∑saya( xsaya^- xsaya)2σ2
χ2nnn - 1
P( χ2α2, n≤ n RMSE2σ2≤ χ21 - α2, n) =1-α⇔ P.⎛⎝n RMSE2χ21 - α2, n≤ σ2≤ n RMSE2χ2α2, n⎞⎠= 1 - α⇔ P.⎛⎝⎜nχ21 - α2, n------√RMSE ≤σ≤ nχ2α2, n-----√RMSE ⎞⎠⎟= 1 - α .
Oleh karena itu,
adalah interval kepercayaan Anda.
⎡⎣⎢nχ21 - α2, n------√RMSE , nχ2α2, n-----√RMSE ⎤⎦⎥
Berikut adalah program python yang mensimulasikan situasi Anda
from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
y[i] =sqrt( mean((random.randn(n)*s)**2))
print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)
Semoga itu bisa membantu.
Jika Anda tidak yakin apakah asumsi tersebut berlaku atau jika Anda ingin membandingkan apa yang saya tulis dengan metode yang berbeda, Anda selalu dapat mencoba bootstrap .