Может ли Nokogiri искать теги "? Xml-stylesheet"?

Мне нужно проанализировать таблицу стилей XML:

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="/templates/xslt/inspections/disclaimer_en.xsl"?>

Используя Nokogiri, я попробовал:

doc.search("?xml-stylesheet").first['href']

но я получаю ошибку:

`on_error': unexpected '?' after '' (Nokogiri::CSS::SyntaxError)

2 ответа

Nokogiri не может искать теги, которые являются инструкциями обработки XML. Вы можете получить к ним доступ следующим образом:

doc.children[0]

Это не элемент XML; это XML "Инструкция по обработке". Вот почему вы не смогли найти его по вашему запросу. Чтобы найти его, вы хотите:

# Find the first xml-stylesheet PI
xss = doc.at_xpath('//processing-instruction("xml-stylesheet")')

# Find every xml-stylesheet PI
xsss = doc.xpath('//processing-instruction("xml-stylesheet")')

Видно в действии:

require 'nokogiri'
xml = <<ENDXML
  <?xml version="1.0" encoding="UTF-8"?>
  <?xml-stylesheet type="text/xsl" href="/templates/disclaimer_en.xsl"?>
  <root>Hi Mom!</root>
ENDXML
doc = Nokogiri.XML(xml)
xss = doc.at_xpath('//processing-instruction("xml-stylesheet")')
puts xss.name     #=> xml-stylesheet
puts xss.content  #=> type="text/xsl" href="/templates/disclaimer_en.xsl"

Поскольку инструкция обработки не является элементом, она не имеет атрибутов; вы не можете, например, попросить xss['type'] или же xss['href']; вам нужно будет проанализировать контент как элемент, если вы этого хотите. Один из способов сделать это:

class Nokogiri::XML::ProcessingInstruction
  def to_element
    document.parse("<#{name} #{content}/>")
  end
end

p xss.to_element['href'] #=> "/templates/disclaimer_en.xsl"

Обратите внимание, что в Nokogiri или libxml2 существует ошибка, из- за которой объявление XML появляется в документе как инструкция обработки, если до этого есть хотя бы один символ (может быть пробел) <?xml , Вот почему в вышеупомянутом мы ищем специально для обработки инструкций с именем xml-stylesheet ,

Изменить: выражение XPath processing-instruction()[name()="foo"] эквивалентно выражению processing-instruction("foo"), Как описано в спецификации XPath 1.0:

processing-instruction() test может иметь аргумент, который является буквальным; в этом случае это верно для любой инструкции обработки, имя которой равно значению Literal.

Я отредактировал ответ выше, чтобы использовать более короткий формат.

Другие вопросы по тегам