Ada beberapa sumber di Wikipedia, tetapi Anda harus benar-benar beruntung memiliki domain yang merupakan kata bahasa Inggris vanilla biasa, cukup umum untuk muncul di sini.
Anda dapat menggunakan alat pembuat kesalahan ketik kata kunci , atau sesuatu seperti itu, kemudian dengan susah payah memasukkan masing-masing ke Google - yang ironisnya akan mencoba untuk memperbaiki ejaan Anda - kemudian gunakan "pencarian untuk {versi salah eja}" dan lihat berapa banyak pencarian hasil yang Anda dapatkan untuk kesalahan ejaan tertentu:
Menampilkan hasil untuk risalah
Cari saja tretise
Itu memberikan sekitar 117.000 hasil untuk "tretise" vs 17.800.000 hasil untuk "risalah". Jadi sekarang Anda memiliki ide betapa umum kesalahan mengeja itu di seluruh Internet! Jadi, Anda dapat menyukai kesalahan ejaan yang terjadi lebih sering di dunia nyata.
Mungkin yang paling penting, saya juga menemukan halaman-halaman ini:
http://how-to-spell.net/treatise
Bagaimana mengeja risalah?
Benar: risalah .
Salah ejaan umum: tretise - 100%
Yang ternyata memang menggunakan data aktual!
Kami telah mengumpulkan persentase kesalahan eja dari hampir 15.423.252 sesi pemeriksaan ejaan di situs web spellchecker.net (Jan 2010 - Jun 2012).
Idealnya saya akan senang jika Google berbagi data tentang kesalahan ejaan, karena saya curiga mereka memiliki banyak data .. tapi saya tidak yakin apakah mereka mau berbagi, mungkin mereka melihat koreksi ejaan otomatis dari istilah pencarian yang salah ketik sebagai keunggulan kompetitif.
Akan sangat luar biasa jika mereka melakukannya!