Dari mana kata-kata di / usr / share / dict / kata-kata itu berasal?


10

/usr/share/dict/wordsmengandung banyak kata. Bagaimana daftar ini dihasilkan? Apakah isinya sama di berbagai Unix? Apakah ada standar yang menentukan apa yang harus dikandungnya?

Yang saya dapat tampilkan sejauh ini adalah bahwa pada Ubuntu / Debian daftar tersebut berasal dari paket wordlist , tetapi deskripsi mereka tidak memberikan petunjuk tentang bagaimana daftar sebenarnya dihasilkan.

Jawaban:


10

Anda mengajukan beberapa pertanyaan, tetapi saya pikir pertanyaan utamanya adalah:

Apakah ada standar yang menentukan apa yang harus dikandungnya?

Setahu saya, tidak.

Karena itu, pertanyaan terkait Anda:

Bagaimana daftar ini dihasilkan? Apakah isinya sama di berbagai Unix?

dijawab "itu tergantung pada setiap Unix berbeda".

Konvensi termasuk daftar kata sebagai bagian dari sistem operasi berasal dari dalam spell(1)utilitas , yang menggunakannya untuk prosedur memeriksa ejaan primitif.

Prosedur pemeriksaan ejaan dijelaskan dalam makalah akademis "Pengembangan Daftar Ejaan", oleh MD McIlroy dari Bell Labs, 1982 .

Anda harus memeriksa manajer paket sistem operasi Anda untuk mengetahui dari mana daftar ejaan berasal, bagaimana ia dihasilkan, dan alternatif apa yang tersedia.

Di Debian GNU + Linux, misalnya:

  • The /usr/share/dict/wordsfile symbolic link berhasil menggunakan Debian “alternatif” sistem.
  • Paket daftar kata yang umum menyediakan tautan itu adalah wamericanpaket.
  • Dokumentasi paket untuk wamericanmenyatakan daftar kata-katanya berasal dari proyek SCOWL (Daftar Kata Berorientasi Pemeriksa) .

Banyak paket daftar kata lain dapat diinstal; mereka masing-masing memiliki bidang “Menyediakan: daftar kata”:

$ aptitude search '?provides(wordlist)' | wc -l
34

Pada berbagai Unices, Anda perlu melihat sistem paket dan dokumentasi untuk mengetahui sumber dan alternatif daftar kata.


2
FWIW: Pada instalasi minimal Centos 7 x64 (di mana kata-kata file tidak ada), yum install wordslakukan trik untuk saya.
Wossname
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.