SGML парсер.NET рекомендации
В моем проекте на C# я имел дело с задачей синтаксического анализа файла SGML и очень наивно пытался использовать XmlReader, и это привело к некоторым интересным открытиям (т. Е. Разнице между SGML и правильно сформированным XML и т. Д..)
Поэтому я думаю, что мне просто нужен хороший синтаксический анализатор SGML, который преобразует его в XML-файл и идет дальше. В моем поиске я нашел два парсера SGML, которые могут интегрироваться с моим проектом на C#:
- SgmlReader MSDN и
- Парсер SP SGML Джеймса Кларка.
Любые другие рекомендации?
2 ответа
Видимо SgmlReader обновлен здесь:
HTML является реализацией SGML. Если вы хотите правильно проанализировать HTML, вам понадобится синтаксический анализатор SGML. SGMLreader, кажется, хорошо соответствует этим потребностям, и я планирую использовать его сам. Я бы предложил использовать HTML Tidy. Это нативное приложение, но привязки.net для него существуют. Если вам нужен полностью управляемый код, тогда SGMLreader - это то, что вам нужно.