LaTex to Tei (xml)
Я пытаюсь преобразовать текстовый файл в XML.
В частности, мне будет интересно понять, можно ли сгенерировать xml-файл TEI ( http://www.tei-c.org/index.xml) для публикации в сети из текстового файла.
Есть ли какая-нибудь информация о том, как действовать? Не могли бы вы выделить простой пример, как это сделать?
Заранее спасибо,
Lucia
2 ответа
Во-первых: это не волшебное заклинание для решения вопроса, но, поскольку вопрос очень широкий, мой ответ, я надеюсь, описывает разумную стратегию решения рассматриваемых проблем.
Я вижу одну проблему: в то время как LaTex используется для создания визуального представления текста, TEI с точностью до наоборот. Он просто описывает и кодирует вещи, которые можно идентифицировать в тексте, в основном независимо от представления. По этой причине единственный разумный путь от LaTex к TEI - создать представление вывода LaTex в формате XML-close (например, HTML), а затем преобразовать этот вывод в TEI. Итак, вам нужна двухэтапная процедура.
Я думаю, что один из инструментов, перечисленных здесь, поможет вам генерировать хороший вывод HTML, возможно, LaTeXML очень близок к тому, что вам нужно. После этого вам нужно будет перевести этот HTML-вывод в TEI. Если вам достаточно HTML-элементов, более-менее простое преобразование может уже выполнить эту работу, но это зависит от требований, которые вы не указали.
Кстати, есть еще один вопрос, который касается вашего вопроса, может быть, он представляет интерес.
Вы можете использовать pandoc (https://pandoc.org/). Дан документ LaTex (назовем его
data.txt
) как это
\documentclass{article}
\begin{document}
Hello World!
\end{document}
вы можете использовать пандок, как это
pandoc data.txt -f latex -t tei -o latexexample.xml
для создания XML, совместимого с TEI XML:
<p>Hello World!</p>