Saya pikir ini sudah cukup:
#!python
import re
pattern = re.compile(r'<title>([^<]*)</title>', re.MULTILINE|re.IGNORECASE)
pattern.search(text)
... dengan asumsi bahwa teks Anda (HTML) ada dalam variabel bernama "teks".
Ini juga mengasumsikan bahwa tidak ada tag HTML lain yang dapat disematkan secara legal di dalam tag HTML TITLE dan tidak ada cara untuk menyematkan karakter <lainnya secara legal di dalam penampung / blok tersebut.
Namun ...
Jangan gunakan ekspresi reguler untuk penguraian HTML dengan Python. Gunakan pengurai HTML! (Kecuali jika Anda akan menulis parser lengkap, yang akan menjadi pekerjaan ekstra ketika berbagai parser HTML, SGML dan XML sudah ada di pustaka standar.
Jika Anda menangani HTML sup tag "dunia nyata" (yang sering kali tidak sesuai dengan validator SGML / XML apa pun), gunakan paket BeautifulSoup . Ini tidak ada di pustaka standar (belum) tetapi sangat direkomendasikan untuk tujuan ini.
Pilihan lainnya adalah: lxml ... yang ditulis untuk HTML yang terstruktur dengan benar (sesuai standar). Tetapi ia memiliki opsi untuk kembali menggunakan BeautifulSoup sebagai parser: ElementSoup .