Setelah menyederhanakan masalah dengan cara prosedur rutin, itu dapat diselesaikan dengan mengubahnya menjadi program minimisasi ganda yang memiliki jawaban terkenal dengan bukti dasar. Mungkin dualisasi ini adalah "langkah halus" yang disebutkan dalam pertanyaan. Ketidaksetaraan juga dapat dibangun dengan cara yang murni mekanis dengan memaksimalkanmelalui pengganda Lagrange.|Ti|
Pertama, saya menawarkan solusi yang lebih elegan berdasarkan geometri kuadrat terkecil. Ini tidak memerlukan penyederhanaan awal dan hampir segera, memberikan intuisi langsung ke hasilnya. Seperti yang disarankan dalam pertanyaan, masalahnya berkurang pada ketimpangan Cauchy-Schwarz.
Solusi geometris
Pertimbangkan sebagai vektor dimensi dalam ruang Euclidean dengan produk titik yang biasa. Biarkan menjadi vektor dasar dan . Tulis dan untuk proyeksi ortogonal dari dan ke dalam komplemen ortogonal dari . (Dalam terminologi statistik, mereka adalah residu sehubungan dengan sarana.) Kemudian, karena dann y = ( 0 , 0 , ... , 0 , 1 , 0 , ... , 0 ) i th 1 = ( 1 , 1 , ... , 1 ) x y x y 1 X i - ˉ X =x=(X1,X2,…,Xn)ny=(0,0,…,0,1,0,…,0)ith1=(1,1,…,1)x^y^xy1S=| | x | | /√Xi−X¯=x^⋅yS=||x^||/n−1−−−−−√ ,
|Ti|=n−1−−−−−√|x^⋅y|||x^||=n−1−−−−−√|x^⋅y^|||x^||
adalah komponen dalam arah . Oleh Cauchy-Schwarz, ini dimaksimalkan tepat ketika sejajar dengan , untuk itu QED. x x y =(-1,-1,...,-1,n-1,-1,-1,...,-1)/nTi=±√y^x^x^y^= ( - 1 , - 1 , … , - 1 , n - 1 , - 1 , - 1 , … , - 1 ) / n
Tsaya= ± n - 1-----√y^⋅ y^| | y^| |= ± n - 1-----√| | y^| | =± n - 1n--√,
Kebetulan, solusi ini memberikan karakterisasi lengkap dari semua kasus di manadimaksimalkan: mereka semua berbentuk| Tsaya|
x =σy^+ μ 1 = σ( - 1 , - 1 , … , - 1 , n - 1 , - 1 , - 1 , … , - 1 ) + μ ( 1 , 1 , … , 1 )
untuk semua nyata .μ , σ
Analisis ini digeneralisasikan dengan mudah ke kasus di mana digantikan oleh setiap set regressor. Jelas maksimum sebanding dengan panjang sisa ,.T i y | | y | |{ 1 }Tsayay| | y^| |
Penyederhanaan
Karena adalah invarian di bawah perubahan lokasi dan skala, kami dapat mengasumsikan tanpa kehilangan keumuman bahwa jumlah menjadi nol dan kuadratnya berjumlah . Ini mengidentifikasidengan, karena (mean square) adalah . Memaksimalkan itu sama dengan memaksimalkan . Tidak ada generalisasi yang hilang dengan mengambil , karena dapat ditukar.X i n - 1 | T i | | X i | S 1 | T i | 2 = T 2 i = X 2 i i = 1 X iTsayaXsayan - 1| Tsaya|| Xsaya|S1| Tsaya|2= T2saya= X2sayai = 1Xsaya
Solusi melalui formulasi ganda
Masalah ganda adalah untuk memperbaiki nilai dan menanyakan nilai tersisa diperlukan untuk meminimalkan jumlah kuadrat mengingat bahwa . Karena diberikan, ini adalah masalah meminimalkan mengingat bahwa . X j , j ≠ 1 ∑ n j = 1 X 2 j ∑ n j = 1 X j = 0 X 1 ∑ n j = 2 X 2 j ∑ n j = 2 X j = - X 1X21Xj, j ≠ 1∑nj = 1X2j∑nj = 1Xj= 0X1∑nj = 2X2j∑nj = 2Xj= - X1
Solusinya mudah ditemukan dalam banyak cara. Salah satu yang paling dasar adalah menulis
Xj= - X1n - 1+εj, j=2,3,…,n
yang . Memperluas fungsi objektif dan menggunakan jumlah-ke-nol identitas ini untuk menyederhanakannya menghasilkan∑nj=2εj=0
∑j=2nX2j=∑j=2n(−X1n−1+εj)2=∑(−X1n−1)2−2X1n−1∑εj+∑ε2j=Constant+∑ε2j,
segera menampilkan solusi unik adalah untuk semua . Untuk solusi ini,jεj=0j
(n−1)S2=X21+(n−1)(−X1n−1)2=(1+1n−1)X21=nn−1X21
dan
|Ti| = | X1|S= | X1|n( n - 1 )2X21-------√= n - 1n--√,
QED .
Solusi melalui mesin
Kembali ke program sederhana yang kami mulai dengan:
Maksimalkan X21
tunduk pada
∑i = 1nXsaya= 0 dan ∑i = 1nX2saya- ( n - 1 ) = 0.
Metode pengganda Lagrange (yang hampir murni mekanis dan langsung) menyamakan kombinasi linier nontrivial dari gradien dari ketiga fungsi ini menjadi nol:
( 0 , 0 , … , 0 ) = λ1D ( X21) + λ2D ( ∑i = 1nXsaya) + λ3D ( ∑i = 1nX2saya- ( n - 1 ) ) .
Komponen demi komponen, persamaan ini adalahn
0000= 2 λ1X1+== ⋯=λ2λ2λ2+ 2 λ3X1+ 2 λ3X2+ 2 λ3Xn.
Yang terakhir dari mereka menyiratkan baik atau . (Kami dapat mengesampingkan kasus terakhir karena persamaan pertama menyiratkan , meremehkan kombinasi linear.) Batasan jumlah-ke-nol menghasilkan . Batasan jumlah-dari-kotak menyediakan dua solusiX 2 = X 3 = ⋯ = X n = - λ 2 / ( 2 λ 3 ) λ 2 = λ 3 = 0 λ 1 = 0 X 1 = - ( n - 1 ) X 2n - 1X2= X3= ⋯ = Xn= - λ2/ (2 λ3)λ2= λ3= 0λ1= 0X1= - ( n - 1 ) X2
X1= ± n - 1n--√; X 2= X3= ⋯ = Xn= ∓ 1n--√.
Keduanya menghasilkan
| Tsaya| = | X1| ≤ | ± n - 1n--√| = n - 1n--√.