Saya menghapus kata-kata berhenti dari sebuah teks, secara kasar menggunakan kode ini
Saya punya yang berikut ini
$ cat file
file
types
extensions
$ cat stopwords
i
file
types
grep -vwFf stopwords file
Saya mengharapkan hasilnya:
extensions
tapi saya mendapatkan (saya pikir salah)
file
extensions
Seolah-olah kata filetersebut telah dilewati dalam file stopwords. Sekarang inilah sedikit keren: jika saya memodifikasi file stopwords, dengan mengubah satu kata / huruf ipada baris pertama, untuk setiap huruf ascii lain selain f, i, l, e, maka perintah grep yang sama memberi saya hasil yang berbeda dan benar extensions.
Apa yang terjadi di sini dan bagaimana cara memperbaikinya?
Saya menggunakan grep (BSD grep) 2.5.1-FreeBSD pada Mac OSX GNU bash, versi 4.4.12 (1)
ipola menjadi pola kedua dan bukan pola pertama dalam stopwordsfile juga mengubah perilaku.
grepatau dengan GNU grep3.1.
-xsaklar untuk regex baris alih-alih-wuntuk kata? Namun saya pikir-Fsaklar akan membatalkan salah satu dari mereka, atau sebaliknya.