Как получить содержимое между <span class = "attribute first">AUTHOR: </ span>Stepfen King

У меня есть следующий источник:

<p class="byline"><span class="attribute first">AUTHOR: </span>Stephen Butts<span class="attribute">DATE: </span><span class="monthText" style="margin-right:4px;">MAY</span>2015<span class="attribute">SUBJECT: </span>Options</p>

Я хочу использовать XPath для захвата текста / содержимого AUTH: Стивен Кинг. Я пытался использовать следующее, но это не работает:

authors = tree.xpath('//span[@class="attribute first"]/text()', namespaces=ns)

Как это сделать?

1 ответ

Решение

Вам нужен текст p, но нет span, Пытаться:

//p[@class="byline"]/text()[2]

или же

//span[@class="attribute first"]/following-sibling::text()[1]
Другие вопросы по тегам