ambang perhitungan untuk klasifikasi risiko minimum?


11

Misalkan Dua Kelas dan memiliki atribut dan memiliki distribusi dan . jika kita memiliki sebelumnya yang sama untuk matriks biaya berikut:C1C2xN(0,0.5)N(1,0.5)P(C1)=P(C2)=0.5

L=[00.510]

mengapa, adalah ambang batas untuk pengklasifikasi risiko (biaya) minimum?x0<0.5

Ini adalah contoh catatan saya yang saya salah pahami, (yaitu, bagaimana ambang batas ini tercapai?)

Sunting 1: Saya pikir untuk ambang rasio kemungkinan kita dapat menggunakan P (C1) / P (C2).

Sunting 2: Saya menambahkan dari Duda Book on Pattern beberapa teks tentang ambang batas. masukkan deskripsi gambar di sini

Jawaban:


4

Untuk matriks biaya,

L=[00.510]c1c2predictionc1c2truth

hilangnya prediksi kelas ketika kebenarannya adalah kelas adalah , dan biaya prediksi kelas ketika kebenarannya adalah kelas adalah . Tidak ada biaya untuk prediksi yang benar, . Risiko bersyarat untuk memprediksi kedua kelas adalahc 2 L 12 = 0,5 c 2 c 1 L 21 = 1 L 11 = L 22 = 0 R kc1c2L12=0.5c2c1L21=1L11=L22=0Rk

R(c1|x)=L11Pr(c1|x)+L12Pr(c2|x)=L12Pr(c2|x)R(c2|x)=L22Pr(c2|x)+L21Pr(c1|x)=L21Pr(c1|x)
Untuk referensi lihat catatan ini di halaman 15.

Untuk meminimalkan risiko / kerugian, Anda memprediksi jika biaya dari kesalahan melakukannya (itulah hilangnya prediksi yang salah kali probabilitas posterior bahwa prediksi itu salah ) adalah lebih kecil dari biaya salah memprediksi alternatif,L 12 Pr ( c 2 | x )c1L12Pr(c2|x)

Pr(c2|x)Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0,51

L12Pr(c2|x)<L21Pr(c1|x)L12Pr(x|c2)Pr(c2)<L21Pr(x|c1)Pr(c1)L12Pr(c2)L21Pr(c1)<Pr(x|c1)Pr(x|c2)
mana baris kedua menggunakan aturan Bayes ' . Dengan probabilitas sebelumnya yang sama dengan Anda mendapatkan Pr(c2|x)Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0.5
12<Pr(x|c1)Pr(x|c2)

jadi Anda memilih untuk mengklasifikasikan pengamatan sebagai adalah rasio kemungkinan melebihi ambang batas ini. Sekarang tidak jelas bagi saya apakah Anda ingin tahu "ambang terbaik" dalam hal rasio kemungkinan atau dalam hal atribut . Jawabannya berubah sesuai dengan fungsi biaya. Menggunakan Gaussian dalam ketidaksetaraan dengan dan , , x σ 1 = σ 2 = σ μ 1 = 0 μ 2 = 1 1c1xσ1=σ2=σμ1=0μ2=1

12<12πσexp[12σ2(xμ1)2]12πσexp[12σ2(xμ2)2]log(12)<log(12πσ)12σ2(x0)2[log(12πσ)12σ2(x1)2]log(12)<x22σ2+x22σ22x2σ2+12σ2xσ2<12σ2log(12)x<12log(12)σ2
sehingga ambang prediksi dalam halxsaat Anda mencari hanya dapat dicapai jika kerugian dari prediksi salah adalah sama, yaitu karena hanya dengan itu Anda dapat memiliki dan Anda mendapatkan .L12=L21log(L12L21)=log(1)=0x0<12

Jawaban yang bagus, tetapi membingungkan saya! jika Anda ingin memilih atau , mana yang benar? x0=0.5x0<0.5
user153695

Jadi tepat pada batas keputusan Anda tidak dapat memberi tahu dengan tepat apakah pengamatan harus dilakukan di kelas satu atau dua (karena tepat pada batas). Jadi memilih apakah observasi harus di kelas 1 jika atau terserah Anda. Dengan sampel yang cukup besar ini harus terjadi untuk pengamatan sangat sedikit sehingga pada margin itu akan menjadi masalah bagi hasil Anda. x0=0.5ix00.5x0<0.5
Andy

semua masalah saya yang menetapkan karunia untuk itu bahwa prof saya. dihitung dan tidak menerima silakan lihat edit saya dalam pertanyaan, saya ambang tipis harus . x 0 = 0,5 x 0 < 0,5x0<0.5x0=0.5x0<0.5
user153695

mungkin 0,5-ln :)
user153695

1
@ terima kasih, saya benar-benar merindukan itu jadi saya mulai dari akhir yang benar-benar salah.
Andy
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.