Dalam buku Bishop "Klasifikasi Pola dan Pembelajaran Mesin", itu menggambarkan teknik untuk regularisasi dalam konteks jaringan saraf. Namun, saya tidak mengerti satu paragraf yang menjelaskan bahwa selama proses pelatihan, jumlah derajat kebebasan meningkat seiring dengan kompleksitas model. Kutipan yang relevan adalah sebagai berikut:
Alternatif untuk regularisasi sebagai cara mengendalikan kompleksitas jaringan yang efektif adalah prosedur penghentian dini. Pelatihan model jaringan nonlinear berhubungan dengan pengurangan berulang dari fungsi kesalahan yang didefinisikan sehubungan dengan satu set data pelatihan. Untuk banyak algoritma optimisasi yang digunakan untuk pelatihan jaringan, seperti gradien konjugat, kesalahannya adalah fungsi yang tidak bertambah dari indeks iterasi. Namun, kesalahan diukur sehubungan dengan data independen, umumnya disebut set validasi, sering menunjukkan penurunan pada awalnya, diikuti oleh peningkatan ketika jaringan mulai terlalu fit. Oleh karena itu pelatihan dapat dihentikan pada titik kesalahan terkecil sehubungan dengan set data validasi, seperti yang ditunjukkan pada Gambar 5.12, untuk mendapatkan jaringan yang memiliki kinerja generalisasi yang baik.Perilaku jaringan dalam kasus ini kadang-kadang dijelaskan secara kualitatif dalam hal jumlah efektif derajat kebebasan dalam jaringan, di mana jumlah ini dimulai dari kecil dan kemudian tumbuh selama proses pelatihan, sesuai dengan peningkatan stabil dalam efektivitas. kompleksitas model.
Ia juga mengatakan bahwa jumlah parameter bertambah selama pelatihan. Saya berasumsi bahwa dengan "parameter", ini mengacu pada jumlah bobot yang dikendalikan oleh unit tersembunyi jaringan. Mungkin saya salah karena bobotnya dicegah bertambah besar oleh proses regularisasi tetapi jumlahnya tidak berubah. Mungkinkah itu merujuk pada proses menemukan sejumlah unit tersembunyi yang bagus?
Apa derajat kebebasan dalam jaringan saraf? Parameter apa yang meningkat selama pelatihan?