Saya memiliki string yang terlihat seperti ini:
6Â 918Â 417Â 712
Cara yang jelas untuk memangkas string ini (seperti yang saya mengerti Python) adalah dengan mengatakan string itu dalam variabel yang disebut s
, kita dapatkan:
s.replace('Â ', '')
Itu seharusnya berhasil. Tetapi tentu saja ia mengeluh bahwa karakter non-ASCII '\xc2'
dalam file blabla.py tidak dikodekan.
Saya tidak pernah bisa mengerti bagaimana beralih di antara pengkodean yang berbeda.
Ini kodenya, benar-benar sama seperti di atas, tetapi sekarang ada dalam konteks. File tersebut disimpan sebagai UTF-8 di notepad dan memiliki header berikut:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
Kode:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
Tidak lebih dari s.replace
...
u