HtmlAgilityPack Get Rendered HTML

Я использую HTMLAgilityPack и хочу, чтобы документ отображался на веб-сайте. Имеется ввиду, если элемент html имеет видимость: display: none, я не хочу, чтобы этот узел был в моем документе.

И есть ли способ исключить такие узлы, имеющие видимый: ни один или скрытый??

например

<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>

1 ответ

Html Agility Pack не имеет представления о том, что означают CSS и Javascript, поэтому он просто анализирует HTML и позволяет вам решить, что с ним делать. Если вы хотите, чтобы страница была полностью оценена перед захватом содержимого, вам потребуется более продвинутый анализатор HTML. Авесониум приходит на ум. Или вы можете обернуть PhantomJS (посмотрите источники ChutzPah, чтобы увидеть, как это можно сделать).

Другие вопросы по тегам