Получить sgml разрешить регулярное выражение для "example.xom/page/200/"

Я пытаюсь получить регулярное выражение для "example.com/page/200/".

Вот что я сделал до сих пор:

rules = (Rule (SgmlLinkExtractor(
  allow=("//page/\d+",),
  restrict_xpaths=('xxxxx',)),
  callback="details", follow= True),
)

Кто-нибудь из вас может дать мне решение? Благодарю.

1 ответ

Решение

У вас есть лишний слеш, и вам нужно использовать необработанную строку. И, поскольку существует только одно выражение, вам не нужно передавать кортеж allow:

rules = (Rule(SgmlLinkExtractor(allow=r"/page/\d+", restrict_xpath=('xxxxx',)), 
              callback="details", follow= True),)
Другие вопросы по тегам