Baik menggabungkan atau menjalankan setiap iterasi pelatihan dengan urutan yang berbeda adalah hal yang benar untuk dilakukan. Pendekatan yang benar membutuhkan beberapa penjelasan:
Seseorang biasanya melatih HMM menggunakan algoritma EM. Ini terdiri dari beberapa iterasi. Setiap iterasi memiliki satu langkah "perkiraan" dan satu "maksimalkan". Pada langkah "maksimalkan", Anda menyelaraskan setiap vektor observasi x dengan keadaan s dalam model Anda sehingga beberapa kemungkinan pengukuran dimaksimalkan. Pada langkah "perkiraan", untuk setiap negara bagian, Anda memperkirakan (a) parameter model statistik untuk vektor x yang selaras dengan s dan (b) probabilitas transisi keadaan. Dalam iterasi berikut, langkah memaksimalkan berjalan kembali dengan model statistik yang diperbarui, dll. Proses ini diulang beberapa kali atau ketika ukuran kemungkinan berhenti naik secara signifikan (yaitu, model konvergen ke solusi stabil). Akhirnya, (setidaknya dalam pengenalan ucapan) sebuah HMM biasanya akan memiliki "awal" yang ditunjuk
Jadi, jika Anda memiliki beberapa urutan pelatihan, pada langkah perkiraan Anda harus menjalankan setiap urutan sehingga vektor observasi awal sejajar dengan keadaan awal. Dengan cara itu, statistik pada keadaan awal dikumpulkan dari pengamatan pertama atas semua urutan pengamatan Anda, dan secara umum vektor pengamatan disejajarkan dengan keadaan yang paling mungkin di setiap urutan. Anda hanya akan melakukan langkah memaksimalkan (dan iterasi di masa depan) setelah semua urutan diberikan untuk pelatihan. Pada iterasi berikutnya, Anda akan melakukan hal yang persis sama.
Dengan menyelaraskan awal dari setiap urutan pengamatan dengan keadaan awal, Anda menghindari masalah urutan gabungan di mana Anda akan salah memodelkan transisi antara akhir satu urutan dan awal berikutnya. Dan dengan menggunakan semua urutan pada setiap iterasi Anda menghindari memberikan urutan yang berbeda setiap iterasi, yang sebagai responden dicatat, tidak akan menjamin konvergensi.