Latar Belakang: Ketika menyesuaikan jaringan saraf dengan aktivasi relu, saya menemukan bahwa kadang-kadang prediksi menjadi hampir konstan. Saya percaya bahwa ini adalah karena neuron relu mati selama pelatihan seperti yang dinyatakan di sini. ( Apa masalah "ReLU sekarat" dalam jaringan saraf? )
Pertanyaan: Apa yang ingin saya lakukan adalah mengimplementasikan pemeriksaan dalam kode itu sendiri untuk memeriksa apakah neuron sudah mati. Setelah itu, kode dapat mereparasi jaringan jika diperlukan.
Dengan demikian, apa yang dimaksud dengan citeria yang baik untuk memeriksa neuron yang mati? Saat ini saya sedang berpikir untuk memeriksa varian rendah dalam prediksi sebagai citeria.
Jika itu membantu, saya menggunakan keras.