Как я могу преобразовать HTML в XML (который соответствует схеме XML или DTD)
Я пытаюсь преобразовать некоторые файлы HTML в формат XML в Ubuntu, и они должны соответствовать определенной схеме XML или DTD. Я полагаю, что Тиди должен это сделать, но я не понимаю синтаксис для этого. Или, если есть другие инструменты, я буду рад их опробовать. Например: конвертировать file.htm
в file.xml
(что соответствует standard.DTD
) Спасибо
1 ответ
Решение
Tidy может конвертировать HTML в XHTML (ту же структуру элементов и атрибутов, но соответствующую правилам правильности XML), но он не может конвертировать ее в соответствии с требованиями некоторых произвольных DTD.
Для этого вам нужно написать явное сопоставление между двумя форматами данных. XSLT - популярный язык для этого.