Извлечение информации из файлов SGM с использованием Python

Мне нужна помощь для извлечения информации из файла.sgm с использованием Python. Есть ли конкретная библиотека, подходящая для этого конкретного типа файла? Или библиотеки, используемые для извлечения информации из XML-файлов, также будут работать? Если нет доступных библиотек, можете ли вы предложить мне хороший модуль, который я могу загрузить для работы с файлами.sgm?

И, прежде всего, если таковые имеются, не могли бы вы объяснить мне разницу между.xml и.sgm файлом?

Спасибо!

1 ответ

Решение

Вот несколько библиотек, которые можно использовать для анализа файлов.sgm:

Основное различие между ними заключается в том, что SGML допускает следующее:

Незакрытые старт-тэги

Незакрытые конечные метки

Пустые старт-теги

Пустые метки

Рекомендации

Другие вопросы по тегам