Pertanyaan yang diberi tag «beautifulsoup»

Beautiful Soup adalah paket Python untuk mengurai HTML / XML. Versi terbaru dari paket ini adalah versi 4, diimpor sebagai bs4.

28
UnicodeEncodeError: 'ascii' codec tidak dapat menyandikan karakter u '\ xa0' di posisi 20: ordinal tidak dalam jangkauan (128)
Saya mengalami masalah berurusan dengan karakter unicode dari teks yang diambil dari halaman web yang berbeda (di situs yang berbeda). Saya menggunakan BeautifulSoup. Masalahnya adalah bahwa kesalahan tidak selalu dapat direproduksi; kadang-kadang bekerja dengan beberapa halaman, dan kadang-kadang, itu muntah dengan melempar a UnicodeEncodeError. Saya telah mencoba hampir semua yang …

16
Bagaimana menemukan elemen berdasarkan kelas
Saya mengalami masalah dalam menguraikan elemen HTML dengan atribut "class" menggunakan Beautifulsoup. Kode terlihat seperti ini soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div Saya mendapatkan kesalahan pada baris yang sama "setelah" skrip selesai. File "./beautifulcoding.py", line 130, in getlanguage if (div["class"] …

12
bs4.FeatureNotFound: Tidak dapat menemukan pembuat pohon dengan fitur yang Anda minta: lxml. Apakah Anda perlu menginstal parser library?
... soup = BeautifulSoup(html, "lxml") File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__ % ",".join(features)) bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library? Output di atas pada Terminal saya. Saya di Mac OS 10.7.x. Saya memiliki Python 2.7.1, dan mengikuti …

6
UnicodeEncodeError: codec 'charmap' tidak dapat menyandikan karakter
Saya mencoba mengikis situs web, tetapi itu memberi saya kesalahan. Saya menggunakan kode berikut: import urllib.request from bs4 import BeautifulSoup get = urllib.request.urlopen("https://www.website.com/") html = get.read() soup = BeautifulSoup(html) print(soup) Dan saya mendapatkan kesalahan berikut: File "C:\Python34\lib\encodings\cp1252.py", line 19, in encode return codecs.charmap_encode(input,self.errors,encoding_table)[0] UnicodeEncodeError: 'charmap' codec can't encode characters in …

5
TypeError: objek byte-seperti diperlukan, bukan 'str' dalam python dan CSV
TypeError: diperlukan objek seperti byte, bukan 'str' mendapatkan kesalahan di atas saat Menjalankan kode python di bawah ini untuk menyimpan data tabel HTML dalam file Csv. tidak tahu cara mendapatkan rideup. Tolong bantu saya. import csv import requests from bs4 import BeautifulSoup url='http://www.mapsofindia.com/districts-india/' response=requests.get(url) html=response.content soup=BeautifulSoup(html,'html.parser') table=soup.find('table', attrs={'class':'tableizer-table'}) list_of_rows=[] for …

11
Beautiful Soup dan mengekstraksi div dan isinya dengan ID
soup.find("tagName", { "id" : "articlebody" }) Mengapa ini TIDAK mengembalikan <div id="articlebody"> ... </div>tag dan barang-barang di antaranya? Tidak mengembalikan apa pun. Dan aku tahu pasti itu ada karena aku menatap langsung darinya soup.prettify() soup.find("div", { "id" : "articlebody" }) juga tidak berfungsi. ( EDIT: Saya menemukan bahwa BeautifulSoup tidak …


17
ImportError: No Module Named bs4 (BeautifulSoup)
Saya bekerja dengan Python dan menggunakan Flask. Ketika saya menjalankan file Python utama saya di komputer saya, itu bekerja dengan sempurna, tapi ketika saya mengaktifkan venv dan menjalankan file Flask Python di terminal, dikatakan bahwa file Python utama saya memiliki "No Module Named bs4." Setiap komentar atau saran sangat dihargai.



6
Bagaimana menemukan anak node menggunakan BeautifulSoup
Saya ingin mendapatkan semua <a>tag yang merupakan anak dari <li>: <div> <li class="test"> <a>link1</a> <ul> <li> <a>link2</a> </li> </ul> </li> </div> Saya tahu cara menemukan elemen dengan kelas tertentu seperti ini: soup.find("li", { "class" : "test" }) Tetapi saya tidak tahu bagaimana menemukan semua <a>yang merupakan anak-anak <li class=test>tetapi tidak …

6
Mengekstrak nilai atribut dengan beautifulsoup
Saya mencoba mengekstrak konten dari atribut "nilai" tunggal dalam tag "masukan" tertentu pada halaman web. Saya menggunakan kode berikut: import urllib f = urllib.urlopen("http://58.68.130.147") s = f.read() f.close() from BeautifulSoup import BeautifulStoneSoup soup = BeautifulStoneSoup(s) inputTag = soup.findAll(attrs={"name" : "stainfo"}) output = inputTag['value'] print str(output) Saya mendapatkan TypeError: indeks daftar …

9
bisakah kita menggunakan xpath dengan BeautifulSoup?
Saya menggunakan BeautifulSoup untuk mengikis url dan saya memiliki kode berikut import urllib import urllib2 from BeautifulSoup import BeautifulSoup url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html" req = urllib2.Request(url) response = urllib2.urlopen(req) the_page = response.read() soup = BeautifulSoup(the_page) soup.findAll('td',attrs={'class':'empformbody'}) Sekarang dalam kode di atas kita bisa gunakan findAlluntuk mendapatkan tag dan informasi yang terkait …

7
Python: BeautifulSoup - dapatkan nilai atribut berdasarkan atribut name
Saya ingin mencetak nilai atribut berdasarkan namanya, ambil contoh <META NAME="City" content="Austin"> Saya ingin melakukan sesuatu seperti ini soup = BeautifulSoup(f) //f is some HTML containing the above meta tag for meta_tag in soup('meta'): if meta_tag['name'] == 'City': print meta_tag['content'] Kode di atas memberikan a KeyError: 'name', saya percaya ini …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.