Ketika saya menggunakan cut
hari ini, saya menemukan itu tidak memperlakukan karakter UTF-8 sebagai karakter, tetapi 3 karakter karena panjangnya 3 byte.
Ini tampaknya secara umum berlaku untuk banyak alat.
Apakah ada versi coreutils
yang disadari UTF-8?
locale
Output saya :
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
Ini saatnya cut
tidak bekerja
echo 哈哈 | cut -c 2-
��哈
Output yang tepat seharusnya
哈
jika cut -c
bekerja dengan karakter multibyte.
cut
baris perintah Anda ?
echo ßßßß | cut -c 2-
-> �ßßß
( LANG=en_US.UTF-8
)
locale
benar? Apa bacaanlocale
permintaan doa (tanpa argumen)?