Anda dapat menulis perangkat lunak ke:
- Ambil kata kunci dari ekspresi reguler;
- Google kata kunci dan dapatkan daftar hasil;
- Merayapi setiap URI yang dihasilkan dan memfilternya dengan ekspresi reguler lengkap.
Mari kita pelajari suatu kasus: dari site:gog.com
temukan semua game yang memiliki suara Spanyol.
Ekspresi reguler adalah:
Audio[^:]*:[^.,]*Spanish
Itu harus cocok, misalnya:
Audio lanuage: English, German, Spanish, French.
Dan tidak cocok:
Audio language: only-English. Text language: Spanish.
Langkah 1. Biarkan perangkat lunak Anda mencari ini di Google:
site:gog.com audio Spanish inurl:game
inurl:game
di sini berarti hanya mencari di halaman deskripsi game
Langkah 2. Dapatkan 300 tautan yang dihasilkan dan merangkak ke setiap dari mereka.
Langkah 3. Saring hasilnya dengan ekspresi reguler yang diberikan:
Audio[^:]*:[^.,]*Spanish
Ini harus mudah dibangun. Sebenarnya saya tidak mengerti mengapa saya tidak dapat menemukan sesuatu yang sudah dibangun seperti itu.
Karena mesin pencari tidak mampu membeli sumber daya untuk memindai data mereka dengan ekspresi reguler, pekerjaan kotor ini menjadi tanggung jawab Anda, dan komputer Anda harus melakukannya dengan apa yang sudah disediakan oleh mesin pencari.