Secara umum, tidak ada pedoman tentang cara menentukan jumlah lapisan atau jumlah sel memori dalam LSTM.
Jumlah lapisan dan sel yang diperlukan dalam LSTM mungkin tergantung pada beberapa aspek masalah:
The Kompleksitas dari dataset. Jumlah fitur, jumlah titik data dll.
Proses menghasilkan data. Contoh berikut tentang bagaimana proses menghasilkan data dapat memainkan peran penting.
Ex - Prediksi harga minyak dibandingkan dengan prediksi PDB ekonomi yang dipahami dengan baik. Yang terakhir ini jauh lebih mudah daripada yang pertama. Dengan demikian, memprediksi harga minyak mungkin juga membutuhkan lebih banyak sel memori LSTM untuk memprediksi dengan akurasi yang sama dibandingkan dengan PDB.
- Keakuratan yang diperlukan untuk use case. Jumlah sel memori akan sangat bergantung pada ini. Jika tujuannya adalah untuk mengalahkan yang mutakhir - satu membutuhkan lebih banyak sel LSTM secara umum. Bandingkan dengan tujuan menghasilkan prediksi yang masuk akal - yang membutuhkan jumlah sel LSTM yang lebih sedikit.
Saya mengikuti langkah-langkah ini ketika memodelkan menggunakan LSTM:
Coba satu lapisan tersembunyi dengan 2 atau 3 sel memori. Lihat kinerjanya terhadap tolok ukur. Jika itu adalah masalah deret waktu maka saya biasanya membuat perkiraan dari teknik deret waktu klasik sebagai patokan.
Coba dan tambah jumlah sel memori. Jika kinerjanya tidak meningkat banyak maka beralihlah ke langkah berikutnya.
Mulailah membuat jaringan yang dalam yaitu menambah lapisan lain dengan sejumlah kecil sel memori.
Selain:
Tidak ada batasan jumlah tenaga kerja yang dapat dikhususkan untuk mencapai minimum global dari fungsi kerugian dan menyesuaikan parameter hiper terbaik. Jadi, memiliki fokus pada tujuan akhir untuk pemodelan harus menjadi strategi daripada berusaha meningkatkan akurasi sebanyak mungkin.
Sebagian besar masalah dapat ditangani menggunakan 2-3 lapisan jaringan.