Dari apa yang saya lihat, formula smoothing Kneser-Ney (dalam urutan kedua) dalam beberapa hal diberikan sebagai
dengan faktor normalisasi diberikan sebagai
dan probabilitas kelanjutan dari sebuah kataw n
di mana adalah jumlah konteks terlihat di atau, lebih sederhana, jumlah kata yang berbeda yang mendahului kata yang diberikan . Dari apa yang saya mengerti, rumusnya dapat diterapkan secara rekursif. w ∙ w
Sekarang ini menangani kata-kata yang dikenal dalam konteks yang tidak diketahui dengan baik untuk panjang n-gram yang berbeda, tetapi apa yang tidak dijelaskan adalah apa yang harus dilakukan ketika ada kata-kata di luar kamus. Saya mencoba mengikuti contoh ini yang menyatakan bahwa dalam langkah rekursi untuk unigram, . Dokumen kemudian menggunakan ini - mengutip Chen dan Goodman - untuk membenarkan rumus di atas sebagai . P 1 K N (w)=Pcont(w)
Saya gagal melihat cara kerjanya di hadapan kata yang tidak diketahui . Dalam kasus ini karena, jelas, kata yang tidak diketahui tidak melanjutkan apa pun mengenai set pelatihan. Demikian juga jumlah n-gram akan menjadi .P c o n t ( tidak diketahui ) = 0
Selain itu, seluruh istilah mungkin nol jika urutan kata-kata yang tidak dikenal - katakanlah, trigram kata-kata OOD - dijumpai.
Apa yang saya lewatkan?