Как я могу получить неразрывные промежутки между двумя узлами при использовании посетителя узла?
Я пытаюсь разобрать следующий исходный код HTML:
<a href="./">Home</a>
<a href="http://gouessej.wordpress.com/tag/tuer/">Blog</a>
Реализую интерфейс org.jsoup.select.NodeVisitor
. Однако, похоже, пропускается контент между</a>
а также <a
. Отключение красивой печати не решает мою проблему.
Вы можете запустить первый тест JUnit, чтобы воспроизвести эту ошибку:https://github.com/gouessej/HtmlFlow/blob/patch-1/src/test/java/htmlflow/flowifier/test/TestFlowifier.java Он преобразует исходный HTML-код код моей домашней страницы в исходный код Java, он преобразует этот исходный код Java обратно в HTML и сравнивает полученный исходный код HTML с исходным исходным кодом.
PS: Собственно TextNode.getWholeText()
возвращается \n
вместо того \n
.
1 ответ
TextNode.getWholeText()
возвращает неэкранированный текст, мне просто нужно убрать его, вызвав Entities.escape(TextNode.getWholeText())
.