Inilah penjelasan langsung dari sumbernya (hampir)
pada min 22:03
Layak ditonton!
Pada dasarnya dan menurut Douglas Merrill mantan CTO Google itu seperti ini:
1) Anda menulis kata (salah eja) di google
2) Anda tidak menemukan apa yang Anda inginkan (jangan klik pada hasil apa pun)
3) Anda menyadari bahwa Anda salah mengeja kata sehingga Anda menulis ulang kata itu di kotak pencarian.
4) Anda menemukan apa yang Anda inginkan (Anda mengklik tautan pertama)
Pola ini berlipat ganda jutaan kali, menunjukkan kesalahan ejaan yang paling umum dan koreksi "paling umum" apa.
Dengan cara ini Google hampir secara instan, menawarkan koreksi ejaan dalam setiap bahasa.
Ini juga berarti jika dalam semalam semua orang mulai mengeja malam sebagai "nigth" google akan menyarankan kata itu sebagai gantinya.
EDIT
@ThomasRutter: Douglas menggambarkannya sebagai "pembelajaran mesin statistik".
Mereka tahu siapa yang memperbaiki kueri, karena mereka tahu kueri mana yang berasal dari pengguna mana (menggunakan cookies)
Jika pengguna melakukan kueri, dan hanya 10% dari pengguna mengklik hasil dan 90% kembali dan mengetik kueri lain (dengan kata yang dikoreksi) dan kali ini 90% mengklik pada hasil, maka mereka tahu mereka telah menemukan koreksi.
Mereka juga dapat mengetahui apakah itu adalah pertanyaan "terkait" dari dua yang berbeda, karena mereka memiliki informasi tentang semua tautan yang ditampilkan.
Selanjutnya, mereka sekarang memasukkan konteks ke dalam pemeriksaan ejaan, sehingga mereka bahkan dapat menyarankan kata yang berbeda tergantung pada konteksnya.
Lihat demo ini dari google wave (@ 44m 06s) yang menunjukkan bagaimana konteks diperhitungkan untuk secara otomatis memperbaiki ejaan.
Di sini dijelaskan bagaimana pemrosesan bahasa alami itu bekerja.
Dan akhirnya di sini adalah demo luar biasa dari apa yang dapat dilakukan dengan menambahkan terjemahan mesin otomatis (@ 1h 12m 47s) ke dalam campuran.
Saya telah menambahkan jangkar menit dan detik ke video untuk melompat langsung ke konten, jika tidak berfungsi, coba muat ulang halaman atau gulir dengan tangan ke tanda.