Saya memiliki output akurasi classifier dalam persentase dan jumlah sampel input. Apakah ada tes yang dapat mengetahui seberapa signifikan hasilnya menurut informasi ini?
Terima kasih
Saya memiliki output akurasi classifier dalam persentase dan jumlah sampel input. Apakah ada tes yang dapat mengetahui seberapa signifikan hasilnya menurut informasi ini?
Terima kasih
Jawaban:
Anda ingin mendefinisikan distribusi akurasi hanya menebak. Mungkin ini seperti mana binomial ( , ) untuk beberapa p yang diketahui (katakanlah 50%).
Kemudian hitung peluang mengamati hasil yang Anda lakukan, jika model nol ini benar. Di R, Anda bisa menggunakan binom.test
atau menghitungnya langsung dengan pbinom
.
Biasanya Anda ingin membandingkan akurasi bukan dengan "menebak" tetapi dengan beberapa metode alternatif, dalam hal ini Anda dapat menggunakan tes McNemar ; dalam R mcnemar.test
,.
Saya tidak melihat di mana pengujian terhadap keacakan lengkap sangat membantu. Penggolong yang hanya bisa mengalahkan tebakan acak murni tidak terlalu berguna. Masalah yang lebih besar adalah penggunaan proporsi yang diklasifikasikan dengan benar sebagai skor akurasi Anda. Ini adalah aturan penilaian tidak terputus yang dapat dengan mudah dimanipulasi karena arbitrer dan tidak sensitif. Salah satu (dari banyak) cara untuk melihat kekurangannya adalah dengan menghitung proporsi yang diklasifikasikan dengan benar jika Anda memiliki model dengan hanya intersep. Ini akan tinggi jika hasilnya tidak mendekati 0,5 dalam prevalensi.
Setelah Anda memilih aturan yang lebih tepat, akan berharga untuk menghitung interval kepercayaan untuk indeks. Signifikansi statistik tidak terlalu bernilai.
Yang pasti Anda dapat komputer interval kepercayaan . Jika adalah akurasi Anda diestimasi pada set uji elemen , itu menyatakan bahwa Jadi Jadi Anda dapat mengatakan bahwa: Misalnya Anda dapat menghitung interval Wilson .
Saya pikir Anda dapat menghitung berapa banyak berbeda kinerja Anda dari satu acak menghitung keuntungan . Keakuratan classifier acak adalah: mana adalah frekuensi empiris dari kelas yang perkirakan pada set tes, dan adalah angka dari berbagai kelas. Rata-rata classifier acak, yang mengklasifikasikan menebak acak kelas mengandalkan probabilitas prior set tes, mengklasifikasikan contoh kelas dengan benar. Di mana adalah jumlah rekaman kelas
Keuntungannya adalah:
Saya benar-benar berpikir tes statistik dapat dibuat sketsa. Pembilangnya dapat dilihat sebagai variabel acak normal, , tetapi Anda harus mencari tahu variabel variabel apa yang merupakan penyebut variabel bisa.
Anda mungkin tertarik dengan makalah-makalah berikut ini:
Saya pikir mereka membahas apa yang Dimitrios Athanasakis bicarakan.
Saya menerapkan satu opsi Yeh dengan cara yang saya mengerti:
Saya pikir satu hal yang bisa Anda coba adalah tes permutasi. Sederhananya hanya mengubah secara acak pasangan input yang diinginkan input Anda makan ke classifier Anda beberapa kali. Jika gagal mereproduksi sesuatu pada level yang sama lebih dari 100 permutasi yang berbeda dari itu signifikan pada interval 99% dan seterusnya. Ini pada dasarnya adalah proses yang sama yang digunakan untuk mendapatkan nilai-p (yang sesuai dengan probabilitas untuk mendapatkan korelasi linier dari skala yang sama setelah secara acak memasukkan data) dan seterusnya.