Adapun pertanyaan pertama Anda, seseorang harus mendefinisikan "standar", atau mengakui bahwa "model kanonik" telah secara bertahap ditetapkan. Seperti komentar yang ditunjukkan, tampaknya setidaknya cara Anda menggunakan IRWLS agak standar.
Adapun pertanyaan kedua Anda, "pemetaan kontraksi dalam probabilitas" dapat dihubungkan (namun secara informal) dengan konvergensi "algoritma stokastik rekursif". Dari apa yang saya baca, ada literatur besar tentang masalah ini terutama di bidang Teknik. Dalam Ekonomi, kami menggunakan sedikit saja, terutama karya mani Lennart Ljung - makalah pertama adalah Ljung (1977) - yang menunjukkan bahwa konvergensi (atau tidak) dari algoritma stokastik rekursif dapat ditentukan oleh stabilitas (atau tidak) dari persamaan diferensial biasa yang terkait.
(Berikut ini telah kembali bekerja setelah diskusi bermanfaat dengan OP di komentar)
Konvergensi
Saya akan menggunakan sebagai referensi Sabre Elaydi "An Introduction to Difference Equations", 2005, 3d ed.
Analisis ini tergantung pada beberapa sampel data yang diberikan, sehingga diperlakukan sebagai tetap. x′s
Kondisi orde pertama untuk minimalisasi fungsi objektif, dipandang sebagai fungsi rekursif dalam ,
m ( k + 1 ) = N ∑ i = 1 v i [ m ( k ) ] x i ,m
m(k+1)=∑i=1Nvi[m(k)]xi,vi[m(k)]≡wi[m(k)]∑Ni=1wi[m(k)][1]
memiliki titik tetap (argumen fungsi objektif). Oleh Teorema 1.13 hal 27-28 dari Elaydi, jika turunan pertama sehubungan dengan dari RHS , dievaluasi pada titik tetap , menyatakannya , lebih kecil dari kesatuan dalam nilai absolut, maka adalah stabil asimtotik (AS). Terlebih lagi oleh Theorem 4.3 hal.179 kita memiliki bahwa ini juga menyiratkan bahwa titik tetap adalah seragam AS (UAS).
"Asymptotically stable" berarti bahwa untuk beberapa rentang nilai di sekitar titik tetap, sebuah lingkungan , tidak harus berukuran kecil, titik tetapnya menarik[ 1 ] m ∗ A ′ ( m ∗ ) m ∗ ( m ∗ ± γ ) γ = ∞m[1]m∗A′(m∗)m∗
(m∗±γ), dan jika algoritme memberikan nilai di lingkungan ini, ia akan bertemu. Properti menjadi "seragam", berarti bahwa batas lingkungan ini, dan karenanya ukurannya, tidak tergantung pada nilai awal algoritma. Titik tetap menjadi UAS global , jika .
Jadi dalam kasus kami, jika kami membuktikannyaγ=∞
|A′(m∗)|≡∣∣∣∣∑i=1N∂vi(m∗)∂mxi∣∣∣∣<1[2]
kami telah membuktikan properti UAS, tetapi tanpa konvergensi global. Kemudian kita dapat mencoba untuk menetapkan bahwa lingkungan tarik-menarik sebenarnya adalah bilangan real keseluruhan yang diperluas, atau, bahwa nilai awal spesifik yang digunakan OP seperti yang disebutkan dalam komentar (dan itu adalah standar dalam metodologi IRLS), yaitu sampel rata-rata dari 's, , selalu milik lingkungan atraksi titik tetap.ˉ xxx¯
Kami menghitung turunan
∂vi(m∗)∂m=∂wi(m∗)∂m∑Ni=1wi(m∗)−wi(m∗)∑Ni=1∂wi(m∗)∂m(∑Ni=1wi(m∗))2
=1∑Ni=1wi(m∗)⋅[∂wi(m∗)∂m−vi(m∗)∑i=1N∂wi(m∗)∂m]
Kemudian
A′(m∗)=1∑Ni=1wi(m∗)⋅[∑i=1N∂wi(m∗)∂mxi−(∑i=1N∂wi(m∗)∂m)∑i=1Nvi(m∗)xi]
=1∑Ni=1wi(m∗)⋅[∑i=1N∂wi(m∗)∂mxi−(∑i=1N∂wi(m∗)∂m)m∗]
dan
|A′(m∗)|<1⇒∣∣∣∣∑i=1N∂wi(m∗)∂m(xi−m∗)∣∣∣∣<∣∣∣∣∑i=1Nwi(m∗)∣∣∣∣[3]
kita punya
∂wi(m∗)∂m=−ρ′′(|xi−m∗|)⋅xi−m∗|xi−m∗||xi−m∗|+xi−m∗|xi−m∗|ρ′(|xi−m∗|)|xi−m∗|2=xi−m∗|xi−m∗|3ρ′(|xi−m∗|)−ρ′′(|xi−m∗|)⋅xi−m∗|xi−m∗|2=xi−m∗|xi−m∗|2⋅[ρ′(|xi−m∗|)|xi−m∗|−ρ′′(|xi−m∗|)]=xi−m∗|xi−m∗|2⋅[wi(m∗)−ρ′′(|xi−m∗|)]
Memasukkan ini ke kita miliki[3]
∣∣∣∣∑i=1Nxi−m∗|xi−m∗|2⋅[wi(m∗)−ρ′′(|xi−m∗|)](xi−m∗)∣∣∣∣<∣∣∣∣∑i=1Nwi(m∗)∣∣∣∣
⇒∣∣∣∣∑i=1Nwi(m∗)−∑i=1Nρ′′(|xi−m∗|)∣∣∣∣<∣∣∣∣∑i=1Nwi(m∗)∣∣∣∣[4]
Ini adalah kondisi yang harus dipenuhi untuk titik tetap menjadi UAS. Karena dalam kasus kami fungsi penalti adalah cembung, jumlah yang terlibat adalah positif. Jadi kondisi setara dengan[4]
∑i=1Nρ′′(|xi−m∗|)<2∑i=1Nwi(m∗)[5]
Jika adalah fungsi kerugian Hubert, maka kita memiliki cabang kuadratik ( ) dan linear ( ),ρ(|xi−m|)ql
ρ(|xi−m|)=⎧⎩⎨(1/2)|xi−m|2|xi−m|≤δδ(|xi−m|−δ/2)|xi−m|>δ
dan
ρ′(|xi−m|)={|xi−m||xi−m|≤δδ|xi−m|>δ
ρ′′(|xi−m|)={1|xi−m|≤δ0|xi−m|>δ
⎧⎩⎨⎪⎪wi,q(m)=1|xi−m|≤δwi,l(m)=δ|xi−m|<1|xi−m|>δ
Karena kita tidak tahu berapa banyak kami di cabang kuadratik dan berapa banyak dalam linier, kami menguraikan kondisi sebagai ( )|xi−m∗|[5]Nq+Nl=N
∑i=1Nqρ′′q+∑i=1Nlρ′′l<2[∑i=1Nqwi,q+∑i=1Nlwi,l]
⇒Nq+0<2[Nq+∑i=1Nlwi,l]⇒0<Nq+2∑i=1Nlwi,l
yang berlaku. Jadi untuk fungsi loss Huber titik tetap dari algoritma secara seragam asymptotically stable, terlepas dari 's. Kami mencatat bahwa turunan pertama lebih kecil dari satu dalam nilai absolut untuk setiap , bukan hanya titik tetap. xm
Apa yang harus kita lakukan sekarang adalah membuktikan bahwa properti UAS juga bersifat global, atau jika maka termasuk dalam lingkungan atraksi .m(0)=x¯m(0)m∗