Декодирование декодирования URL JavaDecoder не работает

Я пытаюсь сначала захватить все ссылки на веб-странице, применяя приведенный ниже скрипт: а затем я хочу снова использовать эти ссылки. но так как декодирование не всегда работает, и это приводит к неправильной ссылке, и я получаю 404 ошибку.

Document doc = Jsoup.connect(doi_con).ignoreContentType(true).get();

Elements links = doc.select("a[href]");

for (Element link : links) {
    String url = link.absUrl("href");

    //byte[] decodeds1= DatatypeConverter.parseBase64Binary(url);
    //dec_url = DatatypeConverter.printBase64Binary(decodeds1);

    dec_url = java.net.URLDecoder.decode(url, "UTF-8");
}

В этом коде часть декодирования кажется работающей для некоторых URL. Что я получил в качестве образцов ниже:

http://link.springer.com/signup-login?previousUrl=/article/10.1007%2Fs10899-005-5558-2
http://link.springer.com/article/10.1007/s10899-005-5558-2#kb-nav--main

Как видно из первой ссылки, расшифровка не работала, а для более поздней она работала.

Что мне не хватает? Я также попробовал parseBase64Binary и printBase64Binary, как видно из приведенного выше кода, но опять-таки это не сработало.

Заранее спасибо!

0 ответов

Другие вопросы по тегам