Нормализовать пространство для элементов списка и извлечь как массив, используя Scrapy
Я ищу эффективный способ извлечь элементы списка в виде массива. Они должны быть лишены каких-либо лишних пробелов. В настоящее время я делаю это:
actions = []
actions_list = sel.xpath('//div[label="Actions Taken"]/article/div/ul')
action_items = actions_list.xpath('li')
for a in action_items:
actions.append(a.xpath('normalize-space(text())')[0].extract())
Массив действий хранится в моей базе данных. Есть ли более эффективный способ сделать это в Scrapy?
1 ответ
Следующий xpath должен делать то же, что и вы:
sel.xpath('normalize-space(//div[label="Actions Taken"]/article/div/ul/li/text()[0])').extract()
но это зависит от страницы