Menyetujui penyalahgunaan istilah teknis. Saya sedang mengerjakan proyek segmentasi semantik melalui jaringan saraf convolutional (CNNs); mencoba untuk mengimplementasikan arsitektur tipe Encoder-Decoder, oleh karena itu output adalah ukuran yang sama dengan input.
Bagaimana Anda mendesain label? Apa fungsi kerugian yang harus diterapkan? Terutama dalam situasi ketidakseimbangan kelas berat (tetapi rasio antara kelas adalah variabel dari gambar ke gambar).
Masalahnya berkaitan dengan dua kelas (objek yang menarik dan latar belakang). Saya menggunakan Keras dengan backend tensorflow.
Sejauh ini, saya akan merancang keluaran yang diharapkan menjadi dimensi yang sama dengan gambar input, menerapkan pelabelan piksel-bijaksana. Lapisan akhir model memiliki aktivasi softmax (untuk 2 kelas), atau aktivasi sigmoid (untuk menyatakan probabilitas bahwa piksel tersebut milik kelas objek). Saya mengalami masalah dalam merancang fungsi obyektif yang cocok untuk tugas seperti itu, dengan tipe:
function(y_pred,y_true)
,
dalam perjanjian dengan Keras .
Tolong, cobalah untuk spesifik dengan dimensi tensor yang terlibat (input / output model). Setiap pemikiran dan saran sangat dihargai. Terima kasih !