Извлечение информации из файлов SGM с использованием Python
Мне нужна помощь для извлечения информации из файла.sgm с использованием Python. Есть ли конкретная библиотека, подходящая для этого конкретного типа файла? Или библиотеки, используемые для извлечения информации из XML-файлов, также будут работать? Если нет доступных библиотек, можете ли вы предложить мне хороший модуль, который я могу загрузить для работы с файлами.sgm?
И, прежде всего, если таковые имеются, не могли бы вы объяснить мне разницу между.xml и.sgm файлом?
Спасибо!
1 ответ
Решение
Вот несколько библиотек, которые можно использовать для анализа файлов.sgm:
Основное различие между ними заключается в том, что SGML допускает следующее:
Незакрытые старт-тэги
Незакрытые конечные метки
Пустые старт-теги
Пустые метки
Рекомендации