Regresi logistik untuk multiclass


10

Saya mendapatkan model untuk regresi logistik untuk multiclass yang diberikan oleh

P(Y=j|X(i))=exp(θjTX(i))1+m=1kexp(θmTX(i))

di mana k adalah jumlah kelas theta adalah parameter yang harus diperkirakan j adalah kelas j Xi adalah data pelatihan

Yah satu hal yang tidak saya dapatkan adalah bagaimana bagian penyebut menormalkan model. Maksud saya itu membuat probabilitas tetap antara 0 dan 1.

1+m=1kexp(θmTX(i))

Maksud saya, saya terbiasa dengan regresi logistik

P(Y=1|X(i))=1/(1+exp(θTX(i)))

Sebenarnya saya bingung dengan masalah nominasi. Dalam hal ini karena ini adalah fungsi sigmoid, ia tidak pernah membiarkan nilainya kurang dari 0 atau lebih besar dari 1. Tapi saya bingung dalam kasus multi-kelas. Kenapa gitu?

Ini adalah referensi saya https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-February/029738.html . Saya pikir itu seharusnya menjadi normalisasi

P(Y=j|X(i))=exp(θjTX(i))m=1kexp(θmTX(i))

2
Petunjuk: Dalam regresi logistik secara implisit ada dua probabilitas yang harus dihadapi: probabilitas dan probabilitas . Probabilitas tersebut harus berjumlah . Y = 0 1Y=1Y=01
Whuber

1
Berdasarkan beberapa pos Anda yang lain, Anda tahu cara markup persamaan. Persamaan teks di sini sulit dibaca dan (subskrip?) Membingungkan - dapatkah Anda menandainya dengan ? LATEX
Makro

2
Karena Anda memposting begitu banyak pertanyaan di sini, harap jeda dan baca FAQ kami tentang cara mengajukan pertanyaan yang bagus. Baca bantuan untuk markup sehingga Anda dapat membuat persamaan Anda dapat dibaca. TEX
Whuber

Saya telah mengedit persamaan. @ Whuber Sebenarnya, saya bingung terkait dengan regresi logistik multikelas bukan biner. Saya khawatir bagaimana bisa ketika saya menambahkan semua elemen dalam donominator menormalkan probabilitas
user34790

@ user34790, ketika Anda membagi setiap istilah dengan jumlah, maka probabilitas kelas individu berjumlah 1. Apa yang dimaksud dengan ? X(i)
Makro

Jawaban:


13

Formula Anda salah (batas atas jumlah). Dalam regresi logistik dengan kelas ( ) Anda pada dasarnya membuat model regresi logistik biner mana Anda memilih satu kelas sebagai referensi atau pivot. Biasanya, kelas terakhir dipilih sebagai referensi. Dengan demikian, probabilitas kelas referensi dapat dihitung denganBentuk umum probabilitasnya adalahKarena kelas -th adalah referensi Anda dan karenanyaK > 2 K - 1 K P ( y i = K | x i ) = 1 - K - 1 Σ k = 1 P ( y i = k | x i ) . P ( y i = k | x i ) = exp ( θ T i x i )KK>2K1K

P(yi=K|xi)=1k=1K1P(yi=k|xi).
KθK=(0,,0)TK i=1exp(θ T i xi)=exp(0)+ K - 1 i=1exp(θ T i xi)
P(yi=k|xi)=exp(θiTxi)i=1Kexp(θiTxi).
KθK=(0,,0)Tk < K P ( y i = k | x i ) = exp ( θ T i x i )
i=1Kexp(θiTxi)=exp(0)+i=1K1exp(θiTxi)=1+i=1K1exp(θiTxi).
Pada akhirnya Anda mendapatkan rumus berikut untuk semua : k<K
P(yi=k|xi)=exp(θiTxi)1+i=1K1exp(θiTxi)

4
perhatikan bahwa pilihan kelas referensi tidak penting, jika Anda melakukan kemungkinan maksimum. Tetapi jika Anda melakukan kemungkinan maksimum yang dihukum, atau inferensi bayesian, seringkali lebih bermanfaat untuk membiarkan probabilitas terlalu parameter, dan membiarkan hukuman memilih cara menangani parameterisasi berlebihan. Ini karena sebagian besar fungsi penalti / prior tidak berbeda dengan pilihan kelas referensi
probabilityislogic

@sebp, sepertinya agak membingungkan; akan lebih baik menggunakan untuk observasi, dan beberapa surat lainnya untuk kategori iterasi. i kiik
garej

4

Saya pikir Anda sedang bingung oleh salah ketik: Anda harus pada persamaan pertama. Angka 1 yang Anda lihat dalam kasus logistik sebenarnya s, misalnya, ketika ada th . k - 1 exp ( 0 ) k θ = 0kk1exp(0)kθ=0

Asumsikan . Sekarang perhatikan bahwa Anda bisa mendapatkan dari formulasi terakhir ke versi regresi logistik seperti Untuk beberapa kelas, cukup ganti penyebut dalam dua kuantitas pertama dengan jumlah lebih dari prediksi linear eksponensial. exp ( b )θ1X=b

exp(b)exp(0)+exp(b)=exp(0)exp(0)+exp(b)=11+exp(b)
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.