Bagaimana saya dapat menemukan kesalahan ejaan umum untuk nama domain saya?


38

Saya ingin mendaftarkan salah eja untuk nama domain saya, tetapi saya tidak ingin secara spekulatif mendaftarkan miliaran formulir "hanya menebak". Misalnya, alat ini menawarkan opsi berikut dalam Pembuat Typo Kata Kunci

  • lewati huruf
  • huruf ganda
  • membalikkan huruf
  • lewati spasi
  • kunci tidak terjawab
  • kunci yang dimasukkan

Mana yang hebat, dan menghasilkan lusinan jika bukan ratusan kemungkinan nama domain ... tetapi tidak memberi tahu saya hal yang paling penting: manakah dari salah eja ini yang paling banyak terjadi dengan pengguna langsung di Internet yang sebenarnya?

Bagaimana saya bisa menemukan data kesalahan ejaan yang sebenarnya dari pengguna nyata?

Jawaban:


25

Ada beberapa sumber di Wikipedia, tetapi Anda harus benar-benar beruntung memiliki domain yang merupakan kata bahasa Inggris vanilla biasa, cukup umum untuk muncul di sini.

Anda dapat menggunakan alat pembuat kesalahan ketik kata kunci , atau sesuatu seperti itu, kemudian dengan susah payah memasukkan masing-masing ke Google - yang ironisnya akan mencoba untuk memperbaiki ejaan Anda - kemudian gunakan "pencarian untuk {versi salah eja}" dan lihat berapa banyak pencarian hasil yang Anda dapatkan untuk kesalahan ejaan tertentu:

Menampilkan hasil untuk risalah

Cari saja tretise

Itu memberikan sekitar 117.000 hasil untuk "tretise" vs 17.800.000 hasil untuk "risalah". Jadi sekarang Anda memiliki ide betapa umum kesalahan mengeja itu di seluruh Internet! Jadi, Anda dapat menyukai kesalahan ejaan yang terjadi lebih sering di dunia nyata.

Mungkin yang paling penting, saya juga menemukan halaman-halaman ini:

http://how-to-spell.net/treatise

Bagaimana mengeja risalah?

Benar: risalah .

Salah ejaan umum: tretise - 100%

Yang ternyata memang menggunakan data aktual!

Kami telah mengumpulkan persentase kesalahan eja dari hampir 15.423.252 sesi pemeriksaan ejaan di situs web spellchecker.net (Jan 2010 - Jun 2012).

Idealnya saya akan senang jika Google berbagi data tentang kesalahan ejaan, karena saya curiga mereka memiliki banyak data .. tapi saya tidak yakin apakah mereka mau berbagi, mungkin mereka melihat koreksi ejaan otomatis dari istilah pencarian yang salah ketik sebagai keunggulan kompetitif.

Akan sangat luar biasa jika mereka melakukannya!


2
Jangan lupa bahwa Anda juga dapat bertanya kepada pengguna Anda!
Alex L

2
The Google Triliion kata corpus pasti termasuk kedua kata benar dan salah dieja, sehingga Anda bisa menggunakannya dan banyak kata dan angka-angka untuk menghitung ini sendiri dari data mentah Google tidak berbagi.
hippietrail

OpenDNS dan Google Public DNS jelas memiliki informasi seperti ini, tetapi tidak ada yang memberikannya melainkan menggunakannya untuk meningkatkan layanan mereka sendiri (OpenDNS memiliki fitur koreksi kesalahan ketik). Anda bisa memulai layanan DNS gratis / gratis Anda sendiri dan mengumpulkan data, saya kira.
Christian Davén

1
Saya tidak berpikir menggunakan hasil Google adalah ide yang baik (bahkan jika tidak praktis). Seperti xkcd tunjukkan pada blag- nya , "" Jumlah hasil "dihitung bahwa Google memberikan ketika Anda mencari dengan jelas dibuat".
rodrigoq

9

Masalah menarik. Anda dapat menggunakan alat pencarian kata kunci Google di https://adwords.google.com/o/KeywordTool untuk mengetahui berapa banyak pencarian per bulan dilakukan untuk setiap kesalahan ketik nama domain Anda (Anda harus membuat daftar kesalahan ketik dengan alat yang Anda sebutkan di atas). Tidak sempurna, tetapi akan mewakili kesalahan ketik pengguna yang sebenarnya dan memberi Anda beberapa data yang layak untuk melanjutkan. (Saya baru saja mengujinya dan mendapatkan beberapa hasil yang tampaknya masuk akal.)


Sayangnya, ini tidak lagi benar, sekarang kita memiliki burung kolibri. Alat Kata Kunci Google telah deprecated. Itu diganti dengan Perencana Kata Kunci, produk Google AdSense.
Ellie Kesselman

4

Pertanyaan menarik, menganalisis hasil pencarian seperti yang dijelaskan di sini harus menjadi posisi awal yang baik tetapi peka terhadap positif palsu yang disebabkan oleh situs web lain dengan nama yang mirip dengan Anda. Mungkin juga kehilangan kesalahan umum yang tidak Anda pikirkan, melihat daftar yang saya katakan menganalisis pengalihan kata mungkin menarik juga.

Metode yang sangat baik dalam menemukan kesalahan mana yang paling umum dibuat oleh pengunjung umum adalah dengan meminta mereka untuk mengetikkan namanya. Tentu saja tidak semua situs web cocok untuk ini, dengan asumsi halaman itu interaktif, itu harus cocok.

Alih-alih menggunakan captcha biasa, cukup tunjukkan beberapa logo situs Anda dengan (bagian dari) nama yang ditulis di sana dan minta orang untuk mengetiknya sebelum mereka dapat melakukan hal mereka.

Data tidak akan didasarkan pada populasi besar seperti pencarian google, tetapi itu akan menjadi kelompok target dan karenanya hasil harus cukup kuat.


1

Anda dapat mencoba pencari kesalahan ketik domain ini . Opsi pencarian berikut ini, secara individu atau dalam kombinasi:

  • Keyboard QWERTY terpeleset
  • Tukar surat
  • Sticky keys, untuk huruf tambahan atau hilang
  • Terlihat seperti huruf lversus angka1

Ada tiga "sudut pandang" untuk pencarian. Pendaftar adalah default. DNS adalah tampilan yang dapat disortir yang menunjukkan nama server dan alamat IP dari setiap kesalahan ketik. TLD menemukan kesalahan ketik pada salah satu dari keenam TLD ini: .com .net .org .biz .us .infodan jika terdaftar.

Apakah ini berbeda dari alat kata kunci OP? Mungkin. Ia mengklaim "menemukan kesalahan ketik umum yang terkait dengan nama domain". Itu berarti data dikumpulkan dari pengguna saat mereka mengetik nama domain secara manual di bilah navigasi browser mereka .

  • Pencarian "Sticky keys" mencakup varian umum, dengan atau tanpa tanda hubung. Jenis kesalahan ketik itu bukan karena cacat fisik, kunci lengket, melainkan kesalahan persepsi manusia. Itu menunjukkan penggunaan sesuatu yang lebih baik daripada pendekatan sistem pakar yang berbasis aturan.
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.