HTML-код проанализированной страницы

Я использую движок разбора Cobra и хочу получить HTML-код уже проанализированной страницы (например, после выполнения javascripts). Можно ли это сделать? При необходимости Cobra может быть заменен другим Java-веб-парсером с открытым исходным кодом.

1 ответ

Ух ты, Кобра на самом деле, кажется, делает это: Пример использования

Это фактически дает вам дерево HTML DOM-узлов. Вы можете использовать HTMLWriter для получения HTML-текста, если вы предпочитаете, но если вы заинтересованы в какой-то определенной его части, используйте XPath, это намного чище, чем поиск в HTML-строке.

Другие вопросы по тегам