Saya menghapus kata-kata berhenti dari sebuah teks, secara kasar menggunakan kode ini
Saya punya yang berikut ini
$ cat file
file
types
extensions
$ cat stopwords
i
file
types
grep -vwFf stopwords file
Saya mengharapkan hasilnya:
extensions
tapi saya mendapatkan (saya pikir salah)
file
extensions
Seolah-olah kata file
tersebut telah dilewati dalam file stopwords. Sekarang inilah sedikit keren: jika saya memodifikasi file stopwords, dengan mengubah satu kata / huruf i
pada baris pertama, untuk setiap huruf ascii lain selain f
, i
, l
, e
, maka perintah grep yang sama memberi saya hasil yang berbeda dan benar extensions
.
Apa yang terjadi di sini dan bagaimana cara memperbaikinya?
Saya menggunakan grep (BSD grep) 2.5.1-FreeBSD pada Mac OSX GNU bash, versi 4.4.12 (1)
i
pola menjadi pola kedua dan bukan pola pertama dalam stopwords
file juga mengubah perilaku.
grep
atau dengan GNU grep
3.1.
-x
saklar untuk regex baris alih-alih-w
untuk kata? Namun saya pikir-F
saklar akan membatalkan salah satu dari mereka, atau sebaliknya.