Разбор HTML с помощью Spray

Я получаю исключение The entity “nbsp” was referenced, but not declared при анализе действительного HTML, который содержит &nbsp объект (который делает его недействительным XML; я не контролирую сервер), в то время как демонтирует HttpEntity в NodeSeq с spray.httpx.unmarshalling.BasicUnmarshallers.NodeSeqUnmarshaller,

Я, вероятно, могу предварительно обработать HTML для удаления &nbsp, но каков принятый метод для анализа HTML (с &nbsp) со спреем?

1 ответ

Решение

Вы можете попытаться написать Custom Unmarshaller, который оборачивает JSoup.

Другие вопросы по тегам