Java и RFC 3986 кодировка URI

Есть ли класс для кодирования общего String соответствует спецификации RFC 3986?

То есть: "hello world" => "hello%20world" Нет (RFC 1738): "hello+world"

Спасибо

5 ответов

Решение

Если это URL, используйте URI

URI uri = new URI("http", "//hello world", null);
String urlString = uri.toASCIIString();
System.out.println(urlString);

Источник: Twitter RFC3986-совместимые функции кодирования.

Этот метод принимает строку и преобразует ее в специфическую кодированную строку RFC3986.

/** The encoding used to represent characters as bytes. */
public static final String ENCODING = "UTF-8";

public static String percentEncode(String s) {
    if (s == null) {
        return "";
    }
    try {
        return URLEncoder.encode(s, ENCODING)
                // OAuth encodes some characters differently:
                .replace("+", "%20").replace("*", "%2A")
                .replace("%7E", "~");
        // This could be done faster with more hand-crafted code.
    } catch (UnsupportedEncodingException wow) {
        throw new RuntimeException(wow.getMessage(), wow);
    }
}

Не знаю, есть ли такой. Есть класс, который обеспечивает кодирование, но он меняет " " на "+". Но вы можете использовать метод replaceAll в классе String для преобразования "+" в то, что вы хотите.

str.repaceAll ("+", "% 20")

В случае веб-приложений Spring я смог использовать это:

http://static.springsource.org/spring/docs/3.1.x/javadoc-api/org/springframework/web/util/UriComponentsBuilder.html

UriComponentsBuilder.newInstance()
  .queryParam("KEY1", "Wally's crazy empôrium=")
  .queryParam("KEY2", "Horibble % sign in value")
  .build().encode("UTF-8") // or .encode() defaults to UTF-8

возвращает строку

? КЛЮЧ1= Уолли%20crazy%20emp%C3%B4rium%3D&KEY2=Horibble%20%25%20sign%20in%20value

Перекрестная проверка на одном из моих любимых сайтов показывает тот же результат, "Процентное кодирование для URI". Выглядит хорошо для меня. http://rishida.net/tools/conversion/

Другие вопросы по тегам