Biarkan mewakili ruang input Anda, yaitu ruang tempat data Anda berada. Pertimbangkan fungsi sehingga mengambil titik dari ruang input Anda dan memetakannya ke titik di . Sekarang, katakanlah kami telah memetakan semua titik data Anda dari ke ruang baru ini . Sekarang, jika Anda mencoba menyelesaikan linear svm normal di ruang baru ini alih-alih , Anda akan melihat bahwa semua kerja sebelumnya hanya terlihat sama, kecuali bahwa semua titik direpresentasikan sebagaiXΦ:X→FXFXFFXxiΦ(xi)dan alih-alih menggunakan (produk titik) yang merupakan produk dalam alami untuk ruang Euclidean, kami menggantinya dengan yang mewakili produk dalam alami di ruang baru . Jadi, pada akhirnya, akan terlihat seperti,xTy⟨Φ(x),Φ(y)⟩Fw∗
w∗=∑i∈SVhiyiΦ(xi)
dan karenanya,
⟨w∗,Φ(x)⟩=∑i∈SVhiyi⟨Φ(xi),Φ(x)⟩
Demikian pula,
b∗=1|SV|∑i∈SV(yi−∑j=1N(hjyj⟨Φ(xj),Φ(xi)⟩))
dan aturan klasifikasi Anda terlihat seperti: .cx=sign(⟨w,Φ(x)⟩+b)
Sejauh ini bagus, tidak ada yang baru, karena kami hanya menerapkan SVM linear normal ke ruang yang berbeda. Namun, bagian ajaibnya adalah ini -
Katakanlah ada fungsi sedemikian rupa sehingga . Kemudian, kita dapat mengganti semua produk titik di atas dengan . Seperti disebut fungsi kernel.k:X×X→Rk(xi,xj)=⟨Φ(xi),Φ(xj)⟩k(xi,xj)k
Karenanya, dan terlihat seperti,
w∗b∗
⟨w∗,Φ(x)⟩=∑i∈SVhiyik(xi,x)
b∗=1|SV|∑i∈SV(yi−∑j=1N(hjyjk(xj,xi)))
Untuk fungsi kernel manakah substitusi di atas valid? Nah, itu pertanyaan yang sedikit terlibat dan Anda mungkin ingin mengambil bahan bacaan yang tepat untuk memahami implikasinya. Namun, saya hanya akan menambahkan bahwa hal di atas berlaku untuk RBF Kernel.
Untuk menjawab pertanyaan Anda, "Apakah situasinya sehingga semua vektor dukungan diperlukan untuk klasifikasi?" Iya. Seperti yang Anda perhatikan di atas, kami menghitung produk dalam dengan alih-alih menghitung secara eksplisit. Ini mengharuskan kami untuk mempertahankan semua vektor dukungan untuk klasifikasi.wxw
Catatan: The di bagian akhir di sini adalah solusi untuk dua kali dari SVM di ruang dan bukan . Apakah itu berarti bahwa kita perlu tahu berfungsi secara eksplisit? Untungnya, tidak. Jika Anda melihat tujuan ganda, itu hanya terdiri dari produk dalam dan karena kami memiliki yang memungkinkan kami untuk menghitung produk dalam secara langsung, kami tidak perlu mengetahui secara eksplisit. Sasaran ganda hanya terlihat seperti,
hiFXΦkΦ
max∑ihi−∑i,jyiyjhihjk(xi,xj)subject to : ∑iyihi=0,hi≥0