Может ли Nokogiri искать теги "? Xml-stylesheet"?
Мне нужно проанализировать таблицу стилей XML:
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="/templates/xslt/inspections/disclaimer_en.xsl"?>
Используя Nokogiri, я попробовал:
doc.search("?xml-stylesheet").first['href']
но я получаю ошибку:
`on_error': unexpected '?' after '' (Nokogiri::CSS::SyntaxError)
2 ответа
Nokogiri не может искать теги, которые являются инструкциями обработки XML. Вы можете получить к ним доступ следующим образом:
doc.children[0]
Это не элемент XML; это XML "Инструкция по обработке". Вот почему вы не смогли найти его по вашему запросу. Чтобы найти его, вы хотите:
# Find the first xml-stylesheet PI
xss = doc.at_xpath('//processing-instruction("xml-stylesheet")')
# Find every xml-stylesheet PI
xsss = doc.xpath('//processing-instruction("xml-stylesheet")')
Видно в действии:
require 'nokogiri'
xml = <<ENDXML
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="/templates/disclaimer_en.xsl"?>
<root>Hi Mom!</root>
ENDXML
doc = Nokogiri.XML(xml)
xss = doc.at_xpath('//processing-instruction("xml-stylesheet")')
puts xss.name #=> xml-stylesheet
puts xss.content #=> type="text/xsl" href="/templates/disclaimer_en.xsl"
Поскольку инструкция обработки не является элементом, она не имеет атрибутов; вы не можете, например, попросить xss['type']
или же xss['href']
; вам нужно будет проанализировать контент как элемент, если вы этого хотите. Один из способов сделать это:
class Nokogiri::XML::ProcessingInstruction
def to_element
document.parse("<#{name} #{content}/>")
end
end
p xss.to_element['href'] #=> "/templates/disclaimer_en.xsl"
Обратите внимание, что в Nokogiri или libxml2 существует ошибка, из- за которой объявление XML появляется в документе как инструкция обработки, если до этого есть хотя бы один символ (может быть пробел) <?xml
, Вот почему в вышеупомянутом мы ищем специально для обработки инструкций с именем xml-stylesheet
,
Изменить: выражение XPath processing-instruction()[name()="foo"]
эквивалентно выражению processing-instruction("foo")
, Как описано в спецификации XPath 1.0:
processing-instruction()
test может иметь аргумент, который является буквальным; в этом случае это верно для любой инструкции обработки, имя которой равно значению Literal.
Я отредактировал ответ выше, чтобы использовать более короткий формат.