Saya punya beberapa ratus file kode sumber html. Saya perlu mengekstraksi konten <div>
elemen tertentu dari masing-masing file ini jadi saya akan menulis skrip untuk mengulangi setiap file. Struktur elemennya seperti ini:
<div id='the_div_id'>
<div id='some_other_div'>
<h3>Some content</h3>
</div>
</div>
Adakah yang bisa menyarankan metode dimana saya dapat mengekstrak div the_div_id
dan semua elemen anak dan konten dari file menggunakan baris perintah linux?
hxselect
lebih pilih-pilih tentang format input daripadapup
. Misalnya, saya mendapatkanInput is not well-formed. (Maybe try normalize?)
denganhxselect
manapup
hanya parsing itu.