Jawaban:
Banyak pengklasifikasi dapat memprediksi skor kontinu. Seringkali, skor kontinu adalah hasil antara yang hanya dikonversi ke label kelas (biasanya dengan ambang batas) sebagai langkah terakhir klasifikasi. Dalam kasus lain, misalnya probabilitas posterior untuk keanggotaan kelas dapat dihitung (misalnya analisis diskriminan, regresi logistik). Anda dapat menghitung MSE menggunakan skor kontinu ini daripada label kelas. Keuntungannya adalah Anda menghindari hilangnya informasi karena dikotomisasi.
Ketika skor kontinu adalah probabilitas, metrik MSE disebut skor Brier.
Namun, ada juga masalah klasifikasi yang agak masalah regresi yang menyamar. Di bidang saya yang dapat misalnya mengklasifikasikan kasus berdasarkan apakah konsentrasi beberapa zat melebihi batas hukum atau tidak (yang merupakan masalah dua kelas biner / diskriminatif). Di sini, MSE adalah pilihan alami karena sifat regresi yang mendasari tugas.
Dalam makalah ini kami menjelaskannya sebagai bagian dari kerangka kerja yang lebih umum:
C. Beleites, R. Salzer dan V. Sergo:
Validasi Model Klasifikasi Lunak menggunakan Keanggotaan Kelas Parsial: Konsep Sensitivitas Berkepanjangan & Co. yang diterapkan pada Grading of Astrocytoma Networks
Chemom. Intell. Laboratorium. Syst., 122 (2013), 12 - 22.
Cara menghitungnya: jika Anda bekerja di R, satu implementasi ada di paket "softclassval", http: /softclassval.r-forge.r-project.org.
Saya tidak mengerti bagaimana ... klasifikasi yang sukses adalah variabel biner (benar atau tidak), jadi sulit untuk melihat apa yang akan Anda kuadratkan.
Umumnya klasifikasi diukur pada indikator seperti persentase yang benar, ketika klasifikasi yang telah diperkirakan dari suatu set pelatihan, diterapkan pada set pengujian yang telah disisihkan sebelumnya.
Mean square error tentu saja dapat (dan) dihitung untuk prakiraan atau nilai prediksi dari variabel kontinu, tapi saya pikir tidak untuk klasifikasi.
Untuk taksiran probabilitas Anda ingin menghitung bukan MSE tetapi kemungkinan:
Kemungkinan ini untuk respons biner, yang diasumsikan memiliki distribusi Bernoulli.
Jika Anda mengambil log dan kemudian meniadakan, Anda mendapatkan kehilangan logistik, yang merupakan analog dari MSE ketika Anda memiliki respons biner. Secara khusus, MSE adalah kemungkinan log negatif untuk tanggapan berkelanjutan yang dianggap memiliki distribusi normal.
Secara teknis Anda bisa, tetapi fungsi MSE adalah non-cembung untuk klasifikasi biner. Jadi, jika model klasifikasi biner dilatih dengan fungsi Biaya MSE, itu tidak dijamin untuk meminimalkan fungsi Biaya . Juga, menggunakan MSE sebagai fungsi biaya mengasumsikan distribusi Gaussian yang tidak berlaku untuk klasifikasi biner.