Dalam Algoritma SVM, mengapa vektor w ortogonal dengan hyperplane pemisah?


13

Saya seorang pemula dalam Pembelajaran Mesin. Dalam SVM, hyperplane pemisah didefinisikan sebagai . Mengapa kita katakan vektor w ortogonal ke hyperplane yang memisahkan?y=wTx+bw


3
Jawaban untuk pertanyaan serupa (untuk jaringan saraf) ada di sini .
bogatron

@ Bogatron - Saya setuju dengan Anda sepenuhnya. Tapi yang saya hanya jawaban spesifik SVM .
Programmer berjudul

2
Kecuali itu tidak. Jawaban Anda benar tetapi tidak ada yang spesifik untuk SVM (juga seharusnya tidak ada). hanyalah persamaan vektor yang mendefinisikan hyperplane. wTx=b
bogatron

Jawaban:


10

Geometris, vektor w diarahkan orthogonal ke jalur yang didefinisikan oleh . Hal ini dapat dipahami sebagai berikut:wTx=b

Pertama ambil . Sekarang jelas bahwa semua vektor, x , dengan menghilang produk batin dengan w memuaskan persamaan ini, yaitu semua vektor ortogonal untuk w memuaskan persamaan ini.b=0xw

Sekarang terjemahkan hyperplane dari asal ke vektor a. Persamaan untuk bidang sekarang menjadi: , yaitu kita menemukan bahwa untuk offset b = a T w , yang merupakan proyeksi dari vektor a ke vektor w .(xa)Tw=0b=aTwaw

Tanpa kehilangan sifat umum maka kita dapat memilih tegak lurus terhadap bidang, dalam hal ini panjang yang mewakili jarak ortogonal terpendek antara titik asal dan bidang datar.||a||=|b|/||w||

Karenanya vektor dikatakan orthogonal terhadap hyperplane pemisah.w


4

Alasan mengapa adalah normal untuk hyper-plane adalah karena kami mendefinisikannya seperti itu:w

P0P0=x0,y0,z0(0,0,0)<x0,y0,z0>P(x,y,z)PP0

PP0=<xx0,yy0,zz0>

n^

n^(PP0)=0
n^Pn^P0=0
n^P0bn^wPxw

2

wTx+b=0xaxb

wTxa+b=0wTxb+b=0

wT.(xaxb)=0xaxbxbxawT.(xaxb)wTxaxb


0

Menggunakan definisi aljabar vektor yang ortogonal ke hyperplane:

 x1,x2

wT(x1x2)=(wTx1+b)(wTx2+b)=00=0 .
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.