Am×nm≥nvAv1=argmaxv∈Rn∥Av∥2subject to ∥v∥2=1.(1)
v1Av2=argmaxv∈Rn∥Av∥2subject to ⟨v1,v⟩=0,∥v∥2=1.
v1,…,vnRnRnA
Biarkan (jadi mengkuantifikasi daya ledak dalam arah ). Misalkan vektor satuan didefinisikan sehingga
Persamaan (2) dapat diekspresikan secara ringkas menggunakan notasi matriks sebagai
mana adalah matriks yang kolom ke- adalah , adalah matriks yang Kolom th adalah , danσi=∥Avi∥2σiAviuiAvi=σiuifor i=1,…,n.(2)
AV=UΣ,(3)
Vn×niviUm×niuiΣadalah matriks diagonal dengan entri diagonal ke- adalah . Matriks adalah ortogonal, sehingga kita dapat mengalikan kedua sisi (3) dengan untuk mendapatkan
Tampaknya kita sekarang telah menurunkan SVD dengan hampir nol upaya. Sejauh ini tidak ada langkah yang sulit. Namun, bagian penting dari gambar itu hilang - kita belum tahu bahwa itu ortogonal.n×niσiVVTA=UΣVT.
AU
Inilah fakta penting, bagian yang hilang: ternyata ortogonal bagi :
Saya mengklaim bahwa jika ini tidak benar, maka tidak akan optimal untuk masalah (1). Memang, jika (4) tidak puas, maka akan mungkin untuk meningkatkan dengan mengganggunya sedikit ke arah .Av1Av2⟨Av1,Av2⟩=0.(4)
v1 v1v2
Misalkan (untuk kontradiksi) bahwa (4) tidak puas. Jika sedikit terganggu dalam arah ortogonal , norma tidak berubah (atau setidaknya, perubahan dalam norma dapat diabaikan). Ketika saya berjalan di permukaan bumi, jarak saya dari pusat bumi tidak berubah. Namun, ketika yang terganggu ke arah , vektor yang terganggu di non-orthogonal arah , dan perubahan norma adalah non-diabaikan . Normav1v2v1v1v1v2Av1Av2Av1Av1dapat ditingkatkan dengan jumlah yang tidak dapat diabaikan. Ini berarti bahwa tidak optimal untuk masalah (1), yang merupakan kontradiksi. Saya suka argumen ini karena: 1) intuisi sangat jelas; 2) intuisi dapat dikonversi langsung menjadi bukti yang kuat.v1
Argumen serupa menunjukkan bahwa adalah ortogonal untuk dan , dan seterusnya. Vektor adalah pasangan ortogonal. Ini berarti bahwa vektor satuan dapat dipilih untuk berpasangan orthogonal, yang berarti matriks atas adalah matriks ortogonal. Ini melengkapi penemuan kami tentang SVD.Av3Av1Av2Av1,…,Avnu1,…,unU
Untuk mengubah argumen intuitif di atas menjadi bukti yang kuat, kita harus menghadapi kenyataan bahwa jika terganggu dalam arah , vektor yang terganggu
bukan benar-benar vektor satuan. (Normalnya adalah .) Untuk mendapatkan bukti yang kuat, tentukan
Vektor benar-benar merupakan vektor satuan. Tetapi seperti yang Anda dapat dengan mudah menunjukkan, jika (4) tidak puas, maka untuk nilai cukup kecil kita memiliki
(dengan asumsi bahwa tandav1v2v~1=v1+ϵv2
1+ϵ2−−−−−√v¯1(ϵ)=1−ϵ2−−−−−√v1+ϵv2.
v¯1(ϵ)ϵf(ϵ)=∥Av¯1(ϵ)∥22>∥Av1∥22
ϵdipilih dengan benar). Untuk menunjukkan ini, cukup periksa bahwa . Ini berarti bahwa tidak optimal untuk masalah (1), yang merupakan kontradiksi.f′(0)≠0v1
(Omong-omong, saya sarankan membaca penjelasan Qiaochu Yuan tentang SVD di sini . Khususnya, lihat "Kunci lemma # 1", yang kita bahas di atas. Seperti yang dikatakan Qiaochu, kunci lemma # 1 adalah "hati teknis dekomposisi nilai singular ".)