Проблема с извлечением источника страницы YouTube с помощью Jsoup

Question

Проблема с извлечением источника страницы YouTube с помощью Jsoup

Используя Jsoup, я могу извлечь исходный код большинства страниц веб-сайтов (щелкните правой кнопкой мыши веб-страницу и выберите "Просмотреть исходный код страницы"). Но для любой страницы видео на YouTube я не могу извлечь исходный код страницы. Он не дает правильный исходный код страницы. Пробовали следующую студентку, но не смогли извлечь.

public class App {
  public static void main(String[] args) throws IOException {

    String webUrl = "https://www.youtube.com/watch?v=Zu6o23Pu0Do";
    Document doc = Jsoup.connect(webUrl)
            .userAgent("Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36")
            .get();

    System.out.println(doc);

 }
}

Кто-нибудь может посоветовать это исправить???

Я получаю следующий результат:

1

jsoup webscarab

Источник

user11962495 01 янв '20 в 06:07

1 ответ

Решение

Другие вопросы по тегам jsoup webscarab

user825475 02 янв '20 в 16:19 2020-01-02 16:19 · Accepted Answer · 2020-01-02 16:19

Вы не устанавливаете пользовательский агент, который может запускать антискребковые меры на веб-сайте. Я собираюсь предположить, что проблема в том, что ваше соединение истекает, когда вы запускаете это. Попробуйте использовать следующий пользовательский агент и посмотрите, работает ли он для вас без подключения ().

.userAgent("Mozilla / 5.0 (Macintosh; Intel Mac OS X 10_14_2) AppleWebKit / 537.36 (KHTML, например Gecko) Chrome/71.0.3578.98 Safari/537.36")