Как я могу преобразовать HTML в XML (который соответствует схеме XML или DTD)

Я пытаюсь преобразовать некоторые файлы HTML в формат XML в Ubuntu, и они должны соответствовать определенной схеме XML или DTD. Я полагаю, что Тиди должен это сделать, но я не понимаю синтаксис для этого. Или, если есть другие инструменты, я буду рад их опробовать. Например: конвертировать file.htm в file.xml (что соответствует standard.DTD) Спасибо

1 ответ

Решение

Tidy может конвертировать HTML в XHTML (ту же структуру элементов и атрибутов, но соответствующую правилам правильности XML), но он не может конвертировать ее в соответствии с требованиями некоторых произвольных DTD.

Для этого вам нужно написать явное сопоставление между двумя форматами данных. XSLT - популярный язык для этого.

Другие вопросы по тегам