Interval kepercayaan RMSE


20

Saya telah mengambil sampel titik data dari suatu populasi. Masing-masing poin ini memiliki nilai sebenarnya (diketahui dari kebenaran dasar) dan nilai estimasi. Saya kemudian menghitung kesalahan untuk setiap titik sampel dan kemudian menghitung RMSE sampel.n

Bagaimana saya bisa menyimpulkan semacam interval kepercayaan di sekitar RMSE ini, berdasarkan pada ukuran sampel ?n

Jika saya menggunakan mean, daripada RMSE, maka saya tidak akan memiliki masalah melakukan ini karena saya dapat menggunakan persamaan standar

m=Zσn

tapi saya tidak tahu apakah ini valid untuk RMSE daripada rata-rata. Apakah ada cara agar saya bisa beradaptasi?

(Saya telah melihat pertanyaan ini , tetapi saya tidak memiliki masalah dengan apakah populasi saya berdistribusi normal, yang merupakan jawaban yang ada di sana)


Apa yang khusus Anda hitung ketika Anda "menghitung RMSE sampel"? Apakah itu RMSE dari nilai sebenarnya, dari nilai estimasi, atau perbedaannya?
whuber

2
Saya menghitung RMSE dari perbedaan, yaitu menghitung akar kuadrat dari rata-rata perbedaan kuadrat antara nilai yang benar dan yang diperkirakan.
robintw

Jika Anda tahu 'kebenaran dasar' (meskipun saya tidak yakin apa artinya sebenarnya), mengapa Anda membutuhkan ketidakpastian dalam RMSE? Apakah Anda mencoba membuat semacam kesimpulan tentang kasus-kasus di mana Anda tidak memiliki kebenaran mendasar? Apakah ini masalah kalibrasi?
Glen_b -Reinstate Monica

@ Glen_b: Yup, itulah tepatnya yang kami coba lakukan. Kami tidak memiliki kebenaran dasar untuk seluruh populasi, hanya untuk sampel. Kami kemudian menghitung RMSE untuk sampel, dan kami ingin memiliki interval kepercayaan pada ini karena kami menggunakan sampel ini untuk menyimpulkan RMSE populasi.
robintw

1
Kemungkinan duplikat SE dari RMSE di R
Curious

Jawaban:


15

Dengan alasan yang sama seperti di sini , saya mungkin dapat memberikan jawaban untuk pertanyaan Anda dalam kondisi tertentu.

Biarkan menjadi nilai Anda yang sebenarnya untuk titik data dan nilai estimasi. Jika kita mengasumsikan bahwa perbedaan antara nilai estimasi dan nilai sebenarnya memiliki i t h x ixiithx^i

  1. berarti nol (yaitu didistribusikan di sekitar )xix^ixi

  2. ikuti distribusi normal

  3. dan semua memiliki standar deviasi yang samaσ

pendeknya:

x^ixiN(0,σ2),

maka Anda benar-benar menginginkan interval kepercayaan untuk .σ

Jika asumsi di atas tetap benar mengikuti dengan (bukan ) derajat kebebasan. Ini berarti χ 2 n nn n-1

nRMSE2σ2=n1nsaya(xsaya^-xsaya)2σ2
χn2nn-1

P(χα2,n2nRMSE2σ2χ1-α2,n2)=1-αP(nRMSE2χ1-α2,n2σ2nRMSE2χα2,n2)=1-αP(nχ1-α2,n2RMSEσnχα2,n2RMSE)=1-α.

Oleh karena itu, adalah interval kepercayaan Anda.

[nχ1-α2,n2RMSE,nχα2,n2RMSE]

Berikut adalah program python yang mensimulasikan situasi Anda

from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
    y[i] =sqrt( mean((random.randn(n)*s)**2))

print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)

Semoga itu bisa membantu.

Jika Anda tidak yakin apakah asumsi tersebut berlaku atau jika Anda ingin membandingkan apa yang saya tulis dengan metode yang berbeda, Anda selalu dapat mencoba bootstrap .


1
Saya pikir Anda salah - dia ingin CI untuk RMSE, bukan . Dan saya juga menginginkannya :)σ
Curious

1
Saya pikir saya tidak salah. Coba pikirkan seperti ini: MSE sebenarnya adalah varian sampel karena . Satu-satunya perbedaan adalah bahwa Anda membaginya dengan dan bukan karena Anda tidak mengurangi mean sampel di sini. RMSE kemudian akan sesuai dengan . Oleh karena itu, populasi RMSE adalah dan Anda menginginkan CI untuk itu. Itu yang saya dapatkan. Kalau tidak, saya harus salah paham masalah Anda. nn-1σσMSE=σ^2=1nsaya=1n(xsaya-x^saya)2nn-1σσ
Fabee

10

Alasan dalam jawaban oleh fabee tampaknya benar jika diterapkan pada STDE (standar deviasi kesalahan), bukan RMSE. Menggunakan nomenklatur yang serupa, adalah indeks yang mewakili setiap catatan data, adalah nilai sebenarnya dan adalah pengukuran atau prediksi.saya=1,...,nxsayax^saya

Kesalahan , BIAS, MSE (mean squared error) dan RMSE diberikan oleh: ϵsaya

ϵsaya=x^saya-xsaya,BIAS=ϵ¯=1nsaya=1nϵsaya,MSE=ϵ2¯=1nsaya=1nϵsaya2,RMSE=MSE.

Menyetujui definisi ini, BIAS sesuai dengan rata-rata sampel , tetapi MSE bukan varians sampel yang bias. Sebagai gantinya: atau, jika BIAS dan RMSE dihitung, Perhatikan bahwa varians sampel bias digunakan alih-alih tidak bias , untuk menjaga konsistensi dengan definisi sebelumnya yang diberikan untuk MSE dan RMSE.ϵ

STDE2=(ϵ-ϵ¯)2¯=1nsaya=1n(ϵsaya-ϵ¯)2,
STDE2=(ϵ-ϵ¯)2¯=ϵ2¯-ϵ¯2=RMSE2-BIAS2.

Jadi, menurut pendapat saya interval kepercayaan yang dibuat oleh fabee merujuk pada standar deviasi sampel , STDE. Demikian pula, interval kepercayaan dapat ditetapkan untuk BIAS berdasarkan skor-z (atau skor-t jika ) dan.ϵn<30STDE/n


2
Anda benar, tetapi melewatkan sebagian dari jawaban saya. Saya pada dasarnya berasumsi bahwa BIAS = 0 (lihat asumsi 1). Dalam hal itu, saat Anda diturunkan. Karena dan adalah dan ada solusi bentuk dekat untuk jumlah dua RV , Anda mungkin bisa mendapatkan interval kepercayaan bentuk dekat untuk kasus ketika asumsi 1 dijatuhkan. Jika Anda melakukan itu dan memperbarui jawaban Anda, saya pasti akan membatalkannya. RM.SE2=STDE2RM.SE2BsayaSEBUAHS2χ2χ2
fabee

0

Mengikuti Faaber 1999 , ketidakpastian RMSE diberikan sebagai mana adalah jumlah titik data.

σ(RM.SE^)/RM.SE=12n
n
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.