SGML парсер.NET рекомендации

В моем проекте на C# я имел дело с задачей синтаксического анализа файла SGML и очень наивно пытался использовать XmlReader, и это привело к некоторым интересным открытиям (т. Е. Разнице между SGML и правильно сформированным XML и т. Д..)

Поэтому я думаю, что мне просто нужен хороший синтаксический анализатор SGML, который преобразует его в XML-файл и идет дальше. В моем поиске я нашел два парсера SGML, которые могут интегрироваться с моим проектом на C#:

Любые другие рекомендации?

2 ответа

Решение

Видимо SgmlReader обновлен здесь:

http://developer.mindtouch.com/Community/SgmlReader

HTML является реализацией SGML. Если вы хотите правильно проанализировать HTML, вам понадобится синтаксический анализатор SGML. SGMLreader, кажется, хорошо соответствует этим потребностям, и я планирую использовать его сам. Я бы предложил использовать HTML Tidy. Это нативное приложение, но привязки.net для него существуют. Если вам нужен полностью управляемый код, тогда SGMLreader - это то, что вам нужно.

Другие вопросы по тегам