Проверка IRI, неожиданный сбой с закодированными символами <>

Я работаю с abdera в моем проекте, и он не работает во время анализа IRI-адреса из контента, который содержит уже закодированные символы <и>: &gt; &lt;
Исключение: "org.apache.abdera.i18n.text.InvalidCharacterException: недопустимый символ 0x3c(<)"

Я запутался, так как я знаю эти символы (&gt; &lt;) разрешены в формате IRI.

Могли бы вы, пожалуйста, посоветовать

РЕДАКТИРОВАТЬ: я использую метод getHref() класса org.apache.abdera.model.Link и ссылка что-то вроде: http://blabla.com?xxx&gt;yyy&lt;zzz

1 ответ

Он анализирует символ как сущность XML, поэтому есть два решения:

  • URI Кодировать IRI внутри getHref

    encode("http://blabla.com?xxx&gt;yyy&lt;zzz", "utf-8")
    
  • Используйте другой метод, а не getHref

Рекомендации

Другие вопросы по тегам