Saya memiliki tugas penambangan data di mana saya membuat sistem pengambilan gambar berbasis konten. Saya memiliki 20 gambar dari 5 hewan. Jadi total 100 gambar.
Sistem saya mengembalikan 10 gambar yang paling relevan ke gambar input. Sekarang saya perlu mengevaluasi kinerja sistem saya dengan kurva Precision-Recall. Namun, saya tidak mengerti konsep kurva Precision-Recall. Katakanlah sistem saya mengembalikan 10 gambar untuk gambar gorila, tetapi hanya 4 yang gorila. 6 gambar lainnya yang dikembalikan adalah hewan lain. Jadi,
- presisi adalah
4/10 = 0.4
(relevan dikembalikan) / (semua dikembalikan) - recall adalah
4/20 = 0.2
(relevan dikembalikan) / (semua relevan)
Jadi saya hanya punya titik <0.2,0.4>
,, bukan kurva. Bagaimana saya memiliki kurva (yaitu, satu set poin)? Haruskah saya mengubah jumlah gambar yang dikembalikan (ini diperbaiki pada 10 dalam kasus saya)?