Biasanya, Anda akan mengatur status awal ke nol, tetapi jaringan akan belajar untuk beradaptasi dengan keadaan awal itu.
The artikel berikut menunjukkan mempelajari negara tersembunyi awal atau menggunakan random noise.
Pada dasarnya, jika data Anda menyertakan banyak urutan pendek, maka melatih keadaan awal dapat mempercepat pembelajaran.
Atau, jika data Anda menyertakan sejumlah kecil urutan panjang maka mungkin tidak ada cukup data untuk melatih keadaan awal secara efektif. Dalam hal menggunakan keadaan awal yang bising dapat mempercepat pembelajaran. Sebuah ide yang tidak mereka sebutkan adalah mempelajari mean dan std dari generator kebisingan.
Artikel tersebut mencatat bahwa jika Anda memilih untuk mempelajari keadaan awal, maka menambahkan kebisingan tidak terlalu bermanfaat.