Saya baru-baru ini menjadi tertarik pada LSTM dan saya terkejut mengetahui bahwa bobot dibagi bersama waktu.
Saya tahu bahwa jika Anda berbagi bobot lintas waktu, maka urutan waktu input Anda dapat menjadi panjang variabel.
Dengan bobot bersama, Anda memiliki lebih sedikit parameter untuk dilatih.
Dari pemahaman saya, alasan seseorang akan beralih ke LSTM vs beberapa metode pembelajaran lainnya adalah karena Anda percaya ada semacam struktur temporal / sekuensial / ketergantungan pada data Anda yang ingin Anda pelajari. Jika Anda mengorbankan 'mewah' panjang variabel, dan menerima waktu perhitungan yang lama, bukankah RNN / LSTM tanpa bobot bersama (yaitu untuk setiap langkah saat Anda memiliki bobot berbeda) berkinerja lebih baik atau ada sesuatu yang saya lewatkan?