Berdasarkan TPR dan FPR, saya telah menghasilkan kurva ROC untuk model klasifikasi biner saya. Saya tidak tahu, bagaimana cara menghitung nilai AUC. Saya akan sangat membantu saya jika Anda dapat membantu saya menghitung nilai AUC.
Berdasarkan TPR dan FPR, saya telah menghasilkan kurva ROC untuk model klasifikasi biner saya. Saya tidak tahu, bagaimana cara menghitung nilai AUC. Saya akan sangat membantu saya jika Anda dapat membantu saya menghitung nilai AUC.
Jawaban:
Selamat datang di komunitas!
Seperti yang Anda ketahui, AUC hanyalah area di bawah kurva ROC. Jadi pertanyaannya lebih tentang metode numerik karena Anda memiliki satu set poin dan Anda ingin menghitung area di bawahnya.
Solusi sepele. Cukup buat persegi panjang dari titik yang Anda miliki. Area masing-masing persegi panjang adalah produk tepi. Kemudian jumlahkan mereka! Anda mungkin tidak suka kan ?!
Setelah Riemannian, algoritma paling sederhana dan paling naif untuk melakukan ini. Anda hanya memiliki satu set poin dan Anda hanya menghitung area trapesium antara masing-masing pasangan dan jumlah mereka seperti apa yang Anda lihat pada gambar di bawah ini. Ini memiliki kesalahan perhitungan maksimum karena menyederhanakan banyak masalah.
Jauh lebih baik ketika kita berbicara tentang kurva! Mari kita tetap sederhana dan to the point. Anda dapat memodelkan fungsi Anda di setiap interval menggunakan kuadratik () dan memiliki 3 titik data. Dengan menggunakan tiga titik data Anda, Anda dapat menghitung, dan . Maka area di bawah kurva tidak terlalu sulit, tetapi kami memiliki solusi yang lebih baik! Percayalah atau tidak, nilai integrasi ini sederhana
dimana dan adalah titik akhir interval dan adalah titik tengahnya. Lihat gambar di bawah dari sini untuk membandingkan metode ini.
Metode simpson dan / atau trapesium dapat diterapkan secara rekursif untuk mencapai perhitungan yang lebih akurat. Ini disebut metode Romberg . Keakuratan metode-metode ini berada pada interval yang panjang. Interval yang lebih kecil memberikan integrasi yang lebih akurat. Romberg menggunakan fakta ini untuk secara iteratif mendekati jawaban yang lebih akurat.
Dan tentu saja nada algoritma lebih banyak untuk melakukan itu.
PS: Anda tentu memiliki perpustakaan dan fungsi dalam berbagai bahasa untuk menghitungnya untuk Anda. Scipy menawarkan untuk Python misalnya .
Semoga ini bisa membantu! Semoga berhasil!