Beberapa tahun yang lalu saya menulis makalah tentang ini untuk murid-murid saya (dalam bahasa Spanyol), jadi saya dapat mencoba menulis ulang penjelasan itu di sini. Saya akan melihat IRLS (iteratively reweighted least square) melalui serangkaian contoh peningkatan kompleksitas. Sebagai contoh pertama kita membutuhkan konsep keluarga skala lokasi. Biarkan menjadi fungsi kerapatan yang berpusat pada nol dalam arti tertentu. Kita dapat membangun keluarga kepadatan dengan mendefinisikan
f ( x ) = f ( x ; μ , σ ) = 1f0
manaσ>0adalah parameter skala danμadalah parameter lokasi. Dalam model kesalahan pengukuran, di mana biasanya istilah kesalahan dimodelkan sebagai distribusi normal, kita dapat menggantikan distribusi normal menggunakan keluarga skala lokasi seperti dibangun di atas. Ketikaf0adalah distribusi normal standar, konstruksi di atas memberikan keluargaN(μ,σ).
f(x)=f(x;μ,σ)=1σf0(x−μσ)
σ>0μf0N(μ,σ)
Sekarang kita akan menggunakan IRLS pada beberapa contoh sederhana. Pertama-tama kita akan menemukan estimator ML (kemungkinan maksimum) dalam model
dengan kerapatan
f ( y ) = 1
Y1,Y2,…,Yni.i.d
distribusi Cauchy keluarga lokasi
μ (jadi ini adalah keluarga lokasi). Tetapi pertama-tama beberapa notasi. Kuadrat terkecil tertimbang estimator dari
μ diberikan oleh
μ * = Σ n i = 1 w i y if(y)=1π11+(y−μ)2,y∈R,
μμ
di mana
wiadalah beberapa bobot. Kita akan melihat bahwa ML estimator dari
μdapat dinyatakan dalam bentuk yang sama, dengan
wibeberapa fungsi residual
εi=yi - μ .
Fungsi kemungkinan diberikan oleh
L(y;μ)=(1μ∗=∑ni=1wiyi∑ni=1wi.
wiμwiϵi=yi−μ^.
dan fungsi loglikelihood diberikan oleh
l(y)=-nlog(π)- n Σ i=1log(1+(yi-μ)2).
Turunannya sehubungan dengan
μadalah
∂ l ( y )L(y;μ)=(1π)n∏i=1n11+(yi−μ)2
l(y)=−nlog(π)−∑i=1nlog(1+(yi−μ)2).
μ
mana
ϵi=yi-μ. Tulis
f0(ϵ)=1∂l(y)∂μ===0−∑∂∂μlog(1+(yi−μ)2)−∑2(yi−μ)1+(yi−μ)2⋅(−1)∑2ϵi1+ϵ2i
ϵi=yi−μ dan
f ′ 0 (ϵ)=1f0(ϵ)=1π11+ϵ2 , kita mendapatkan
f ′ 0 (ϵ)f′0(ϵ)=1π−1⋅2ϵ(1+ϵ2)2
Kami menemukan
∂ l ( y )f′0(ϵ)f0(ϵ)=−1⋅2ϵ(1+ϵ2)211+ϵ2=−2ϵ1+ϵ2.
mana kami menggunakan definisi
wi= f ′ 0 ( ϵ i )∂l(y)∂μ===−∑f′0(ϵi)f0(ϵi)−∑f′0(ϵi)f0(ϵi)⋅(−1ϵi)⋅(−ϵi)∑wiϵi
Mengingat bahwa
ϵi=yi-μkita memperoleh persamaan
∑wiyi=μ∑wi,
yang merupakan persamaan estimasi IRLS. Catat itu
wi=f′0(ϵi)f0(ϵi)⋅(−1ϵi)=−2ϵi1+ϵ2i⋅(−1ϵi)=21+ϵ2i.
ϵi=yi−μ∑wiyi=μ∑wi,
- Bobot selalu positif.wi
- Jika residu besar, kami memberikan bobot lebih sedikit untuk pengamatan yang sesuai.
μ^(0)
ϵ(0)i=yi−μ^(0)
w(0)i=21+ϵ(0)i.
μ^μ^(1)=∑w(0)iyi∑w(0)i.
ϵ(j)i=yi−μ^(j)
w(j)i=21+ϵ(j)i.
j+1μ^(j+1)=∑w(j)iyi∑w(j)i.
μ^(0),μ^(1),…,μ^(j),…
f(y)=1σf0(y−μσ)Y1,Y2,…,Ynϵi=yi−μσ
l(y)=−n2log(σ2)+∑log(f0(yi−μσ)).
ν=σ2∂ϵi∂μ=−1σ
∂ϵi∂ν=(yi−μ)(1ν−−√)′=(yi−μ)⋅−12σ3.
∂l(y)∂μ=∑f′0(ϵi)f0(ϵi)⋅∂ϵi∂μ=∑f′0(ϵi)f0(ϵi)⋅(−1σ)=−1σ∑f′o(ϵi)f0(ϵi)⋅(−1ϵi)(−ϵi)=1σ∑wiϵi
σ2∂l(y)∂ν=====−n21ν+∑f′0(ϵi)f0(ϵi)⋅∂ϵi∂ν−n21ν+∑f′0(ϵi)f0(ϵi)⋅(−(yi−μ)2σ3)−n21ν−121σ2∑f′0(ϵi)f0(ϵi)⋅ϵi−n21ν−121ν∑f′0(ϵi)f0(ϵi)⋅(−1ϵi)(−ϵi)⋅ϵi−n21ν+121ν∑wiϵ2i=!0.
σ2^=1n∑wi(yi−μ^)2.
Berikut ini kami memberikan ujian numerik menggunakan R, untuk model eksponensial ganda (dengan skala diketahui) dan dengan data y <- c(-5,-1,0,1,5)
. Untuk data ini nilai sebenarnya dari penaksir ML adalah 0. Nilai awal akan menjadi mu <- 0.5
. Salah satu pass dari algoritma adalah
iterest <- function(y, mu) {
w <- 1/abs(y-mu)
weighted.mean(y,w)
}
dengan fungsi ini Anda dapat bereksperimen dengan melakukan iterasi "dengan tangan" Kemudian algoritma iteratif dapat dilakukan oleh
mu_0 <- 0.5
repeat {mu <- iterest(y,mu_0)
if (abs(mu_0 - mu) < 0.000001) break
mu_0 <- mu }
tkσ
wi=k+1k+ϵ2i.
w(ϵ)=1−eϵ1+eϵ⋅−1ϵ.
Untuk saat ini saya akan meninggalkannya di sini, saya akan melanjutkan posting ini.