Как получить содержимое между <span class = "attribute first">AUTHOR: </ span>Stepfen King
У меня есть следующий источник:
<p class="byline"><span class="attribute first">AUTHOR: </span>Stephen Butts<span class="attribute">DATE: </span><span class="monthText" style="margin-right:4px;">MAY</span>2015<span class="attribute">SUBJECT: </span>Options</p>
Я хочу использовать XPath для захвата текста / содержимого AUTH: Стивен Кинг. Я пытался использовать следующее, но это не работает:
authors = tree.xpath('//span[@class="attribute first"]/text()', namespaces=ns)
Как это сделать?
1 ответ
Решение
Вам нужен текст p
, но нет span
, Пытаться:
//p[@class="byline"]/text()[2]
или же
//span[@class="attribute first"]/following-sibling::text()[1]