Mengapa f beta menentukan beta seperti itu?


10

Ini adalah skor F beta:

Fβ=(1+β2)halrecsayassayaHainrecSebuahll(β2halrecsayassayaHain)+recSebuahll

Artikel Wikipedia menyatakan bahwa .Fβ "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"

Saya tidak mendapatkan ide. Mengapa mendefinisikan seperti itu? Dapatkah saya mendefinisikan seperti ini:F ββFβ

Fβ=(1+β)halrecsayassayaHainrecSebuahll(βhalrecsayassayaHain)+recSebuahll

Dan bagaimana cara menunjukkannya β times as much importance?


2
Lihat jawaban yang lebih baru di bawah ini yang mencakup kalkulus diferensial yang membahas "mengapa Beta kuadrat dan bukan Beta".
javadba

Jawaban:


18

Membiarkan menjadi bobot dalam definisi pertama yang Anda berikan dan sebagai bobot dalam definisi kedua, kedua definisi tersebut setara ketika Anda menetapkan , jadi kedua definisi ini hanya mewakili perbedaan notasi dalam definisi skor . Saya telah melihatnya mendefinisikan kedua cara pertama (misalnya pada halaman wikipedia ) dan yang kedua (misalnya di sini ).˜ β ˜ β = β 2 F βββ~β~=β2Fβ

Ukuran diperoleh dengan mengambil rata-rata harmonis dari presisi dan mengingat, yaitu kebalikan dari rata-rata kebalikan dari kebalikan dan kebalikan dari penarikan:F1

F1=1121precision+121recall=2precisionrecallprecision+recall

Alih-alih menggunakan bobot dalam penyebut yang sama dan menjumlahkan ke 1 ( untuk recall dan untuk presisi), kita dapat menetapkan bobot yang masih berjumlah 1 tetapi untuk yang bobot saat recall adalah kali lebih besar dari bobot pada presisi ( untuk recall dan untuk presisi). Ini menghasilkan definisi kedua Anda dari skor :1212βββ+11β+1Fβ

Fβ=11β+11precision+ββ+11recall=(1+β)precisionrecallβprecision+recall

Sekali lagi, jika kita menggunakan alih-alih sini, kita akan sampai pada definisi pertama Anda, jadi perbedaan antara kedua definisi tersebut hanya notasi.β2β


1
mengapa mereka mengalikan dengan istilah presisi alih-alih istilah recall? β
Anwarvic

1
Kalkulus diferensial yang membahas "mengapa Beta kuadrat dan bukan Beta" dimasukkan dalam jawaban yang lebih baru di bawah ini.
javadba

@Anwarvic Mereka mengalikan dengan recall terbalik . Setelah memperhitungkan dan memperluas dengan ada istilah tersisaβ(1+β)precisionrecallβpresisi
user2740

5

Alasan untuk mendefinisikan skor F-beta dengan adalah persis kutipan yang Anda berikan (yaitu ingin melampirkan kali lebih penting untuk diingat sebagai presisi) memberikan definisi khusus untuk apa artinya melampirkan kali lebih penting untuk diingat daripada presisi.β2ββ

Cara khusus mendefinisikan kepentingan relatif dari dua metrik yang mengarah ke formulasi dapat ditemukan dalam Pengambilan Informasi (Van Rijsbergen, 1979):β2

Definisi: Kepentingan relatif yang dilampirkan pengguna pada presisi dan penarikan kembali adalah rasio di mana , di mana adalah ukuran efektivitas berdasarkan presisi dan daya ingat.P/RE/R=E/PE=E(P,R)

Motivasi untuk ini:

Cara paling sederhana yang saya tahu untuk mengukur ini adalah dengan menentukan rasio di mana pengguna bersedia untuk memperdagangkan kenaikan dalam presisi untuk kerugian yang sama dalam penarikan.P/R

Untuk melihat bahwa mengarah ini ke formulasi kita bisa mulai dengan rumus umum untuk mean harmonik tertimbang dan dan menghitung derivatif parsial mereka sehubungan dengan dan . Sumber yang dikutip penggunaan (untuk "efektivitas mengukur"), yang hanya dan penjelasan setara apakah kita menganggap atau .β2PRPRE1-FEF

F=1(αP+1-αR)

F/P=α(αP+1-αR)2P2

F/R=1-α(αP+1-αR)2R2

Sekarang, pengaturan derivatif sama untuk satu tempat lain pembatasan pada hubungan antara dan rasio . Mengingat bahwa kami ingin melampirkan kali lebih penting untuk dipanggil sebagai presisi, kami akan mempertimbangkan rasio 1 :αP/RβR/P

F/P=F/RαP2=1-αR2RP=1-αα

Mendefinisikan sebagai rasio ini dan mengatur ulang untuk memberikan bobot dalam hal :βαβ2

β=1-ααβ2=1-ααβ2+1=1αα=1β2+1

1-α=1-1β2+1β2β2+1

Kami memperoleh:

F=1(1β2+11P+β2β2+11R)

Yang dapat diatur ulang untuk memberikan formulir di pertanyaan Anda.

Dengan demikian, diberikan definisi yang dikutip, jika Anda ingin melampirkan kali lebih penting untuk dipanggil sebagai presisi maka formulasi harus digunakan. Interpretasi ini tidak berlaku jika seseorang menggunakan . Penafsiran yang setara, kurang intuitif, dalam hal kita hanya menggunakan adalah bahwa kita ingin melampirkan kali lebih penting untuk diingat sebagai presisi.ββ2βββ

Anda dapat menentukan skor seperti yang Anda sarankan, namun Anda harus menyadari bahwa dalam kasus ini interpretasi yang didiskusikan tidak berlaku lagi atau Anda menyiratkan beberapa definisi lain untuk menghitung trade off antara presisi dan recall.

Catatan kaki:

  1. P/R digunakan dalam Pengambilan Informasi tetapi ini tampaknya salah ketik, lihat The Truth of F- Meas (Saski, 2007).

Referensi:

  1. CJ Van Rijsbergen. 1979. Pengambilan Informasi (edisi ke-2), hlm.133-134
  2. Y. Sasaki. 2007. “The Truth of F-Meas”, Pengajaran, materi Tutorial

1
Ini harus menjadi jawaban yang diterima.
javadba

3

Untuk menunjukkan sesuatu dengan cepat.

Ini berarti bahwa ketika nilai beta meningkat, Anda lebih menghargai presisi.

Saya sebenarnya berpikir sebaliknya - karena lebih tinggi lebih baik dalam penilaian F-β, Anda ingin penyebutnya kecil. Karena itu, jika Anda mengurangi β, maka model tersebut dihukum lebih sedikit karena memiliki skor presisi yang baik. Jika Anda meningkatkan β, maka skor F-β akan dihukum lebih banyak ketika presisi tinggi.

Jika Anda ingin menimbang skor F-β sehingga nilai presisi, β harus 0 <β <1, di mana β-> 0 hanya nilai presisi (pembilangnya menjadi sangat kecil, dan satu-satunya hal dalam penyebut yang diingat, sehingga skor F-β berkurang dengan meningkatnya recall).

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html


0

Alasan bahwa β ^ 2 dikalikan dengan presisi hanyalah cara F-Skor didefinisikan. Ini berarti bahwa ketika nilai beta meningkat, Anda lebih menghargai presisi. Jika Anda ingin melipatgandakannya dengan recall yang juga akan berfungsi, itu hanya berarti bahwa ketika nilai beta meningkat Anda lebih menghargai recall.


0

Nilai beta lebih besar dari 1 berarti kami ingin model kami lebih memperhatikan model Recall dibandingkan dengan Precision. Di sisi lain, nilai kurang dari 1 lebih menekankan Presisi.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.