XML: какие правила обработки применяются к значениям, переплетенным с тегами?

Я начал работать над простым XML-разборщиком XML, и поскольку я только что размышлял над тем, что является правильным синтаксисом в XML в отношении определенных символов / последовательностей, игнорируемых пробелов и тому подобного (спасибо, http://www.w3schools.com/xml/xml_elements.asp), я понял, что до сих пор не знаю приседаний о том, что можно набросать как следующий случай (который Validome находит очень хорошо сформированным; обратите внимание, что я хочу использовать только xml) файлы для хранения данных, без сущностей, DTD или схем):

<bookstore>
   <book id="1">
      <author>Kurt Vonnegut Jr.</author>
      <title>Slapstick</title>
   </book>
We drop a pie here.
   <book id="2">Who cares anyway?
      <author>Stephen King</author>
      <title>The Green Mile</title>
   </book>
And another one here.
   <book id="3">
      <author>Next one</author>
      <title>This time with its own title</title>
   </book>
</bookstore>

"Мы бросаем пирог здесь." и "И еще один здесь." значения элемента "книжный магазин". "Кого это волнует?" это значение, относящееся ко второму элементу 'book'.

Как они обрабатываются, если вообще? Будет "Мы бросим пирог здесь." и "Еще один здесь." быть объединены, чтобы сформировать одно значение для элемента 'bookstore', или они обрабатываются отдельно, хранятся где-то, влияя на результат анализа элемента, которому они принадлежат, или...?

1 ответ

Решение

Самый простой способ - проанализировать его с помощью нескольких совместимых со стандартами синтаксических анализаторов и вывести выходные данные.

Другие вопросы по тегам