30/09/2018, 20:56
Cần giúp đỡ regular expression python
Em đang bắt đầu làm quen với python được 1 tháng, và thấy thú vị về lĩnh vực scraping web, muốn xây dựng 1 doạn code để lấy thông tin từ trang cá nhân của một mạng xã hội.
muốn get cái ngày sinh mà mãi k find được:
regex = '<dl class="pinfo_row _pinfo"><dt>День рождения:</dt><dd><a href="/search?c[section]=people&c[bday]=8&c[bmonth]=5">8 мая</a> <a href="/search?c[section]=people&c[byear]=1996">1996 г.</a></dd></dl>'
reg2 = '<dl class="pinfo_row _pinfo"><dt>День рождения:</dt><dd><a href="/search?c\[section\]=people&c\[bday\]=d&c\[bmont\]=d">[^.]*</a> <a href="/search?c\[section\]=people&c\[byear\]=d{1,}">(/+?) г.</a></dd></dl>'indent preformatted text by 4 spaces
Bài liên quan
bạn lấy thông tin từ web nào vậy?
Mình không rành về cái này lắm. Nhưng có cái web này rất hay, có thể test trực tiếp reg của bạn. Bạn thử xem có giúp gì được không.
https://regex101.com/
là bạn muốn lấy số “8” trong “[bday]=8” à?
Không bạn ạ, cái [bday]=8 trong href là để nó search những người sinh ngày 8 tháng năm, hoặc, năm 1996
mình muốn lấy cái 8 Мая và 1996.
Trang vk.com bạn ạ
"\/search.*">(.*?)<\/a>.* <a href="\/search.*">(\d*).*<
Sao bạn không dùng html parser vừa dễ viêt vừa dễ đọc