Apakah mungkin untuk mencari situs MediaWiki menggunakan ekspresi reguler?


9

Saya ingin mencari frasa menggunakan ekspresi reguler di situs-situs seperti Wikipedia dan Wikimedia Commons. Apakah mungkin melakukan ini?

Contoh permintaan pencarian regex: (facebook | google) (riwayat perusahaan | situs web)

Sudah mungkin untuk melakukan hal yang sama di Google ( seperti ditunjukkan di sini ), jadi saya ingin tahu apakah itu mungkin untuk Wikipedia juga.


Apakah Anda bersedia mengunduh beberapa gigabytes data dan melakukan semua penyaringan pada komputer Anda sendiri?
svick

Tampaknya mungkin untuk melakukan ini menggunakan AutoWikiBrowser: en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/…
Anderson Green

Anda dapat menggunakan AWB untuk mencari halaman tertentu (atau serangkaian halaman), tetapi tidak seluruh wiki, yang saya asumsikan adalah yang Anda inginkan.
svick

Ya, saya ingin mencari seluruh wiki. Apakah ada alat di server alat untuk ini?
Anderson Green

Jawaban:


3

Dimungkinkan untuk mencari Wikipedia (atau situs lain mana pun yang dapat diakses oleh mesin pencari) menggunakan ekspresi reguler sederhana, selama Anda mengandalkan mesin pencari. Permintaan pencarian Google berikut mencari Wikipedia untuk kecocokan dari ekspresi reguler (Yahoo|Google|Microsoft):

https://www.google.com/#hl=id&sclient=psy-ab&q=site:en.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + yahoo + OR + microsoft) & gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0.0 ... 1c.1.7.psy-ab.s2oGD_2LKy4 & pbx = 1 & bav = on .2, or.r_cp.r_qf. & Bvm = bv.44158598, d.dmg & fp = dc8abc04c054405e & biw = 1366 & bih = 639



2

Ini tersedia dan diberdayakan oleh CirrusSearch (berdasarkan ElasticSearch ) yang merupakan mesin pencarian yang digunakan di situs MediaWiki, dan platform Wikimedia.

Beberapa contoh penggunaan:

Catatan: Referensi panduan lengkap, dan sumber - di Wikipedia: Bantuan: Mencari # Search_string_syntax .

Adapun pertanyaan Anda:

Operator logis

Mesin pencari mendukung logika boolean dalam pencarian. Operator logis termasuk karakter "-" (tanda minus) untuk "tidak logis", AND, OR, dan tanda kurung kurung pengelompokan: (_).

Logis ATAU harus dieja dengan huruf kapital; AND operator diasumsikan untuk semua istilah (dipisahkan oleh spasi), tetapi modal AND adalah setara.

Lebih banyak contoh:

  • Sederhana AND, OR: "credit card" OR "payment card", "credit card" AND "payment card"- akan berfungsi seperti yang diharapkan.
  • Suffixed tilde karakter untuk pencarian fuzzy ( "suara seperti") - Sebagai contoh, mencari charlie~ parker~kembali Charlie Parker, Charles Palmer, Charley Parks(hingga dua perbedaan karakter, tidak termasuk yang pertama).
  • Pencarian wildcard - pencarian face*e- dimulai dengan facedan diakhiri dengan edengan apa pun di tengah. masukkan deskripsi gambar di sini

Bacaan ekstra

Baca lebih lanjut tentang mesin pencari dan ekstensi ini untuk mengungkap fungsionalitas dan fitur lengkapnya.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.