Apa artinya “berbagi parameter antara fitur dan kelas”


Jawaban:


22

Saya akan mencoba menjawab pertanyaan ini melalui regresi logistik , salah satu pengklasifikasi linear paling sederhana.

Kasus paling sederhana dari regresi logistik adalah jika kita memiliki tugas klasifikasi biner ( y{0,1}) dan hanya satu fitur input ( xR ). Dalam hal ini output dari regresi logistik adalah:

y^=σ(wx+b)
mana dan b keduanya skalar . Output dari model \ hat y \ dalam [0,1] sesuai dengan probabilitas bahwa x akan dari kelas 1 .bwbx1y^[0,1]x1

Kami akan mencoba memecah frasa "classifier linear tidak berbagi parameter antara fitur dan kelas" menjadi dua bagian. Kami akan memeriksa kasus beberapa fitur dan beberapa kelas secara terpisah untuk melihat apakah regresi logistik berbagi parameter untuk semua tugas tersebut:

Apakah classifier linear berbagi parameter di antara fitur?

Dalam kasus ini, untuk setiap contoh, y adalah skalar yang mengambil nilai biner (seperti sebelumnya), sedangkan x adalah vektor dengan panjang N (di mana N adalah jumlah fitur). Di sini, outputnya adalah kombinasi linear dari fitur input (yaitu jumlah berbobot dari fitur ini ditambah bias).

x w N xw w i x i

y^=σ(iN(wixi)+b)orσ(wx+b)
di mana dan adalah vektor dengan panjang . Produk menghasilkan skalar. Seperti yang Anda lihat dari atas, ada bobot terpisah untuk setiap fitur input dan bobot ini independen dengan segala cara. Dari sini kita dapat menyimpulkan bahwa tidak ada berbagi parameter di antara fitur .xwNxw wixi

Apakah pengklasifikasi linier membagikan parameter di antara kelas?

Dalam hal ini adalah skalar, namuny M M y j M y j[ 0 , 1 ]xy adalah vektor dengan panjang (di mana adalah jumlah kelas). Untuk mengatasinya, regresi logistik pada dasarnya menghasilkan output terpisah untuk masing-masing kelasSetiap output adalah skalar dan sesuai dengan probabilitas milik kelas .MMyjMyj[0,1]xj

y^=wx+b,wherey^=y^1,y^2,...,yM

Cara termudah untuk memikirkan ini sebagai sederhana independen regresi logistik masing-masing dengan output:M

y^j=σ(wjx+bj)

Dari penjelasan di atas jelas bahwa tidak ada bobot yang dibagi di antara kelas yang berbeda .

multi-fitur dan multi-kelas :

Dengan menggabungkan dua case di atas kita akhirnya dapat mencapai case paling umum dari beberapa fitur dan beberapa kelas:

y^=σ(Wx+b)
mana adalah vektor dengan ukuran ,y^Mx adalah vektor dengan ukuran , adalah vektor dengan ukuran dan adalah matriks dengan ukuran .NbMW(N×M)

Dalam kasus apa pun, pengklasifikasi linier tidak membagikan parameter apa pun di antara fitur atau kelas .

Untuk menjawab pertanyaan kedua Anda, pengklasifikasi linier memang memiliki asumsi mendasar bahwa fitur harus independen , namun ini bukan yang dimaksudkan oleh penulis makalah ini.


1
Penjelasan yang bagus. :)
joydeep bhattacharjee
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.