percobaan ini oleh Stephen Mayhew menunjukkan bahwa BERT buruk pada pembuatan teks berurutan:
although he had already eaten a large meal, he was still very hungry
Seperti sebelumnya, saya menutupi "lapar" untuk melihat apa yang akan diprediksi BERT. Jika itu dapat memprediksi dengan benar tanpa konteks yang benar, kita mungkin dalam kondisi yang baik untuk generasi.
Ini gagal. BERT memperkirakan "banyak" sebagai kata terakhir. Mungkin ini karena BERT menganggap tidak adanya titik berarti kalimat itu harus dilanjutkan. Mungkin itu hanya digunakan untuk menyelesaikan kalimat sehingga menjadi bingung. Saya tidak yakin.
Orang mungkin berpendapat bahwa kita harus terus memprediksi setelah "banyak". Mungkin itu akan menghasilkan sesuatu yang bermakna. Untuk itu saya akan mengatakan: pertama, ini dimaksudkan sebagai hadiah mati, dan manusia mana pun akan memprediksi "lapar". Kedua, saya mencobanya, dan terus memprediksi hal-hal bodoh. Setelah "banyak", token berikutnya adalah ",".
Jadi, setidaknya menggunakan metode sepele ini, BERT tidak dapat menghasilkan teks.