Описание тега jsoup
Jsoup - это парсер Java HTML для извлечения данных HTML и управления ими с использованием лучших методов DOM, CSS и jQuery.
2
ответа
Как совместить заголовок Http и прочитать содержимое JAVA-программы?
И я получаю программу, которая должна быть использована для получения контента для HTML. public class University { public static void main(String[] args) throws Exception { System.out.println("Started"); URL url = new URL ("http://www.4icu.org/revie…
30 июл '16 в 08:59
0
ответов
Печать точной веб-страницы на Android с помощью JSOUP
Я работаю с последней библиотекой jsoup и хочу разобрать веб-страницу в моем текстовом представлении Android, я просто хочу правильную веб-страницу, так как она отображается в любом веб-браузере и отображается на моей активности Android. Я пробовал …
31 май '13 в 05:53
1
ответ
JSoup не будет получать все предметы?
Итак, я пытаюсь разобрать простой список с помощью JSoup. К сожалению, программа возвращает записи только до тех записей, которые начинаются с N в списке. Я не знаю, почему это так. Вот мой код: public ArrayList<String> initializeMangaNameList…
20 ноя '13 в 20:26
1
ответ
HTMLUnit в Java - Как перейти к страницам GridView
Я пытаюсь создать приложение, используя Java, который будет читать информацию с веб-страницы. Чтобы загрузить информацию из элементов, которые я хочу, я использовал jsoup (отличный инструмент!), Но я хочу загрузить следующую страницу GridView, испол…
24 сен '16 в 07:32
3
ответа
Метод jsoup не найден
Я попытался импортировать все импортные, но в jsoup Connection.Response res = Jsoup.connect("https://www.facebook.com/login.php?login_attempt=1") Класс соединения не найден компилятором и та же проблема с Method.post другие вызовы работают правильно
03 авг '12 в 16:36
2
ответа
Jsoup в CFscript выполняет соединение как POST
Страницу, которую я хочу проанализировать, можно получить только методом POST. Это легко для Java, как я вижу: import org.jsoup.Jsoup; Response res = Jsoup.connect("URL").method(Method.POST).execute(); Document doc = res.parse(); Я не мог произвести…
11 апр '16 в 21:20
1
ответ
Какой тип данных возвращает соединение jsoup
Мне было интересно, какой тип html-данных jsoup connect возвращает. На самом деле, когда вы посещаете веб-сайт, вы можете увидеть два разных типа кодирования данных Когда вы щелкните правой кнопкой мыши и выберите "Просмотр исходного кода" Когда вы …
11 май '15 в 08:10
1
ответ
Можете ли вы очистить CSV с помощью Jsoup?
Я ищу Java инструмент, чтобы очистить CSV с веб-сайта, а затем проанализировать данные. Jsoup кажется жизнеспособным вариантом. Есть ли способ очистить CSV файл, а затем сохранить информацию в базу данных с помощью Jsoup? Или это строго для соскоба …
24 окт '14 в 14:47
2
ответа
Jsoup не может подключиться
Я скачал банку Jsoup и добавил ее в библиотеку. Я добавил настройки прокси в Eclipse. Но когда я попробую это в коде: Document doc = Jsoup.connect("http://www.wikipedia.com").get(); выдает следующую ошибку: Errorjava.net.ConnectException: Connection…
20 июн '14 в 09:33
3
ответа
Как получить все HTML-теги по порядку из HTML-строки в Java
<td valign="top" width="230"> <div> <b><a href="http://www.cs.cornell.edu/johannes/">Johannes Gehrke</a></b> </div> <div class="small"> Professor<br>Computer Science, CS Field Member<br>Dir…
23 ноя '12 в 12:41
1
ответ
JSoup HTTP ошибка получения URL. Статус =405
Я хотел бы подключиться к https://www.notebooksbilliger.de/ но с помощью следующего кода это не работает: try { Response response = Jsoup.connect(url) .userAgent("Mozilla") .ignoreContentType(true) .execute(); System.out.println(response.url()); doc…
05 янв '17 в 14:08
1
ответ
Получение якорной ссылки с помощью Jsoup
Я получаю href с помощью Jsoup.parse(hrefLink, "").select("a[href]").attr("href") где hrefLink основан хрефлинк. Я хочу получить исходящие ссылки с текущей веб-страницы, если они соответствуют моим условиям. К сожалению, из-за якорных ссылок я не вс…
05 апр '14 в 16:05
1
ответ
Как получить правильный форматированный текст из HTML, когда теги не имеют разрывов строк
Я пытаюсь проанализировать этот образец HTML-файла с помощью библиотеки Jsoup HTML-разбора. <html> <body> <p> this is sample text</p> <h1>this is heading sample</h1> <select name="car" size="1"> <option v…
24 фев '14 в 15:11
2
ответа
Избегайте удаления пробелов и новой строки при разборе HTML с помощью jsoup
У меня есть пример кода, как показано ниже. String sample = "<html> <head> </head> <body> This is a sample on parsing html body using jsoup This is a sample on parsing html body using jsoup </body> </html>"; Docum…
03 ноя '16 в 08:07
2
ответа
Получить название изображения с JSOUP
У меня есть этот стол. <div id="activeArrivi"> <div class="aggBox"> <label>Ultimo aggiornamento:</label> <span class="update">21/05/2015 15:25</span> </div> <table> <thead> <tr> <th>C…
21 май '15 в 14:12
3
ответа
Netbeans не декодирует специальные символы
Я пытаюсь проанализировать HTML-файл с помощью Jsoup. В этом HTML есть специальный символ, который я хочу удалить, (€), вот как это изначально: <span class="price-value"> 49,99 € </span> Однако Netbeans показывает это при печати этого эл…
02 апр '16 в 18:03
1
ответ
Jsoup ошибочно закрывает тег и выводит текст тега из тега
Я анализировал фид, но он ошибочно закрывает тег <link />http://wwww Вот мой код для получения HTML с URL Document doc = Jsoup.connect(pURL).get(); doc.outputSettings().outline(false); doc.outputSettings().prettyPrint(false); String html = doc…
20 фев '13 в 16:58
2
ответа
Получить innerHTML через Jsoup
Я пытаюсь собрать данные с этого сайта: http://www.bundesliga.de/de/liga/tabelle/ В исходном коде я могу видеть таблицы, но нет содержимого, только такие вещи, как: <td>[no content]</td> <td>[no content]</td> <td>[no co…
22 фев '14 в 15:05
1
ответ
Вместо перехвата Java MalformedURLException сборка не удалась
Новичок в Java, поэтому, пожалуйста, потерпите меня: (и обратите внимание, что этот вопрос касается исключений Java, а не Jsoup) при использовании Jsoup для получения Html-страницы: (Jsoup.connect(current_url._name).get();), я пытался отловить все 5…
03 дек '16 в 23:17
1
ответ
HTMLUnit getPage NoClassDefFoundError
У меня возникли проблемы со следующим исходным кодом: import com.gargoylesoftware.htmlunit.BrowserVersion; import com.gargoylesoftware.htmlunit.NicelyResynchronizingAjaxController; import com.gargoylesoftware.htmlunit.WebClient; import com.gargoyles…
03 янв '14 в 17:22