Saya ingin menulis skrip yang mencatat ukuran antrian review penutupan suara di SO (saat ini ~ 95.5k), pemungutan suara hanya beberapa kali dalam satu jam, sehingga saya bisa merencanakan tren umum. Saya tahu apa yang akan saya lakukan mengenai penguraian, yaitu diberi bagian berikut dari respons HTTP,
<div class="dashboard-num" title="95,508">95.5k</div>
Saya akan menerapkan regex
<div\s+class="dashboard-num"\s+title="([^"]+)
dan dibagi dengan \D
dan meledak array untuk hanya menyisakan angka, atau sesuatu yang serupa. (Ya, The Pony, He Comes , tapi ini adalah pekerjaan yang cepat dan kotor di mana saya tidak berharap HTML Stack Overflow berubah.)
Saat ini saya tidak memiliki pengaturan UNIX / Linux, kalau tidak saya akan melempar sesuatu menggunakan cron, cURL, dan Perl (atau sed atau awk jika saya merasa cukup berani). Apa cara termudah untuk melakukan ini di Windows? Apakah ada beberapa utilitas yang dibangun untuk melakukan ini? Saya bersedia untuk menginstal Cygwin dan perangkat lunak semacam itu jika memang cara termudah (katakanlah, dibandingkan dengan menulis skrip batch), tetapi saya berharap untuk beberapa program di mana saya dapat menyediakan URL dan regex dan berada di jalan saya.
.msi
dari python.org, jalankan, Anda sudah siap. Jika Anda ingin ekstra, buka lfd.uci.edu/~gohlke/pythonlibs . Apa yang sulit tentang itu?