Получить sgml разрешить регулярное выражение для "example.xom/page/200/"
Я пытаюсь получить регулярное выражение для "example.com/page/200/".
Вот что я сделал до сих пор:
rules = (Rule (SgmlLinkExtractor(
allow=("//page/\d+",),
restrict_xpaths=('xxxxx',)),
callback="details", follow= True),
)
Кто-нибудь из вас может дать мне решение? Благодарю.
1 ответ
Решение
У вас есть лишний слеш, и вам нужно использовать необработанную строку. И, поскольку существует только одно выражение, вам не нужно передавать кортеж allow
:
rules = (Rule(SgmlLinkExtractor(allow=r"/page/\d+", restrict_xpath=('xxxxx',)),
callback="details", follow= True),)