Проверка IRI, неожиданный сбой с закодированными символами <>
Я работаю с abdera в моем проекте, и он не работает во время анализа IRI-адреса из контента, который содержит уже закодированные символы <и>: > <
Исключение: "org.apache.abdera.i18n.text.InvalidCharacterException: недопустимый символ 0x3c(<)"
Я запутался, так как я знаю эти символы (> <
) разрешены в формате IRI.
Могли бы вы, пожалуйста, посоветовать
РЕДАКТИРОВАТЬ: я использую метод getHref() класса org.apache.abdera.model.Link и ссылка что-то вроде: http://blabla.com?xxx>yyy<zzz
1 ответ
Он анализирует символ как сущность XML, поэтому есть два решения:
URI Кодировать IRI внутри
getHref
encode("http://blabla.com?xxx>yyy<zzz", "utf-8")
Используйте другой метод, а не
getHref
Рекомендации