Ekstrak file teks html ke file teks


0

Saya memiliki folder dengan banyak file html, saya ingin mengekstraksi hanya teks yang terdapat di tubuh html ini ke file txt, bagaimana saya bisa melakukan itu?

Jawaban:


1

Anda dapat mengulangi setiap file dalam direktori dan menggunakan browser baris perintah seperti lynx atau w3m untuk membuat HTML menjadi plaintext dan menyimpannya ke dalam file teks.

Contoh Lynx:

lynx -dump in.html > out.txt

contoh w3m:

w3m -dump in.html > out.txt
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.