Hyperparameter hanyalah parameter yang berdampak, sepenuhnya atau sebagian, parameter lainnya. Mereka tidak secara langsung menyelesaikan masalah pengoptimalan yang Anda hadapi, tetapi lebih mengoptimalkan parameter yang dapat menyelesaikan masalah (karena itu hiper , karena mereka bukan bagian dari masalah pengoptimalan, melainkan "addons"). Untuk apa yang saya lihat, tapi saya tidak punya referensi, hubungan ini searah (hyperparameter tidak dapat dipengaruhi oleh parameter yang memiliki pengaruh, maka juga hiper ). Mereka biasanya diperkenalkan dalam skema regularisasi atau meta-optimasi.
Sebagai contoh, parameter Anda dapat dengan bebas memengaruhi μ dan σ untuk menyesuaikan biaya regularisasi (tetapi μ dan σ tidak memiliki pengaruh pada λ ). Jadi, λ adalah hiperparameter untuk μ dan σ . Jika Anda memiliki parameter τ tambahan yang memengaruhi λ , itu akan menjadi hyperparameter untuk λ , dan hyperhyperparameter untuk μ dan σ (tapi saya belum pernah melihat nomenclatura ini, tapi saya tidak akan merasa itu salah jika saya melihatnya) .λμσμσλλμστλλμσ
Saya menemukan konsep hyperparameter sangat berguna untuk validasi silang, karena mengingatkan Anda tentang hierarki parameter, sementara juga mengingatkan Anda bahwa jika Anda masih memodifikasi (hyper-) parameter, Anda masih validasi silang dan tidak generalisasi sehingga Anda harus tetap hati-hati dengan kesimpulan Anda (untuk menghindari pemikiran melingkar).