Описание тега python-requests-html

Requests-HTML - это библиотека Python HTTP, построенная на основе API запросов, добавляющая поддержку синтаксического анализа HTML (с дополнительной поддержкой headless-browser для рендеринга JavaScript).
1 ответ

Не удается извлечь результат, как ожидалось, при использовании request_html

Я не могу извлечь правильный результат с помощью request_html: >>> from requests_html import HTMLSession >>> session = HTMLSession() >>> r = session.get('https://www.amazon.com/dp/B07569DYGN') >>> r.html.find("#pr…
1 ответ

Запросы-HTML Enconding error

Привет ребята, Когда я запускаю этот код: from requests_html import HTMLSession url = 'http://www.spell.org.br/documentos/resultadobusca/?eou%5B%5D=&tipo_busca=simples&campo%5B%5D=RESUMO&texto%5B%5D='\ + parsekeyword(keyword) +\ '&eo…
2 ответа

Не удается найти класс CSS, используя запрос HTML

После изучения этого урока по поиску класса CSS и копированию текста на веб-сайте я попытался внедрить его в небольшой текстовый код, но, к сожалению, это не сработало. Я следовал учебному пособию точно на том же веб-сайте и получил заголовок веб-ст…
02 авг '18 в 22:37
0 ответов

Python html-запросы render() не отображает элементы JavaScript

Я пытаюсь очистить веб-сайт, на котором, помимо входа в систему, основные данные отображаются с помощью файлов JavaScript и XHR. Я использую html-requests библиотека, однако render() Похоже, что функция не влияет на веб-страницу. Вот мой код: import…
1 ответ

Python - Невозможно отправить сообщение Отправить запрос на форму входа

Я пытаюсь отправить сообщение POST для входа в веб-интерфейс, пройти проверку подлинности и использовать cookie-файл для загрузки доступных исторических данных на устройство. Проблема. Похоже, что мой запрос POST не работает, поскольку код не может …
1 ответ

Python request-html с селектором выпадающего списка

Я выполняю очистку на сайте, который содержит сценарий Java для извлечения данных и раскрывающийся список ввода. Я использую запрос-HTML, чтобы иметь дело с частью Java, но я изо всех сил, чтобы выбрать значение в раскрывающемся списке. Вот мой код:…
1 ответ

Как получить имя файла.xls на веб-сайте с Python (запросы-HTML)

Я пытаюсь очистить файлы Excel от финского агентства по ценам на лекарства Я использую запрос-HTML, чтобы найти ссылки на файлы Excel: from requests_html import HTMLSession import urllib.request url = 'http://www.hila.fi/fi/hakeminen_ja_ilmoitukset/…
0 ответов

Утилизация whoscored.com защищена инкапсулами

Я пытаюсь удалить расписание матчей и историю whoscored.com ( https://www.whoscored.com/Regions/252/Tournaments/2/England-Premier-League), и его защищает инкапсула. если я переместлю календарь: - xpath //[@ id = "date-controller"] / a [1] xpath //[@…
17 фев '19 в 14:14
2 ответа

Python Request_html отправить форму, нажав кнопку с помощью JQuery

Я изучаю Kenneth Reitz's request_html и пытаюсь отправить форму визуализированной веб-страницы JS с помощью Jquery. Я не уверен, как это сделать, но вот моя попытка: from requests_html import HTMLSession url = "https://example.com" session = HTMLSes…
26 фев '19 в 15:33
1 ответ

Соскоб ASPX формы и избегая селен

Ранее я спрашивал (см. Здесь), как получить результаты из формы ASPX. Форма отображает вывод в новой вкладке (с помощью функции window.open в JS). В моем предыдущем посте я не делал правильный запрос POST, и я решил это. Следующий код успешно извлек…
2 ответа

Добавление ненужного символа при записи в файл из модуля "запросы" в Python

У меня есть текстовый файл, состоящий из URL в строке следующим образом: https://www.google.com https://www.facebook.com https://www.gmail.com Я использую следующий скрипт: import requests add = open("manual_list.txt","r") for a in add: response = r…
1 ответ

Объединение RoboBrowser с запросами-HTML

Мне нравится простота заполнения и отправки онлайн-форм с использованием RoboBrowser, и я думаю, что понимаю, как получить доступ к экземпляру request.Session(), лежащему в основе RoboBrowser, если мне нужно это использовать. Но я хочу отправить фор…
0 ответов

Как включить SNI в модуле запросов Python

Я хочу убедиться, что мой питон requests имеет SNI включен. Я не мог найти официальную документацию. 1) SNI включен по умолчанию? 2) Если нет, как включить его для запроса? 3) Как узнать список всех возможных параметров и их описание, которое приним…
1 ответ

Очистить текст в <h4>, используя Requests-HTML (Requests-HTML, Python)

Я пытаюсь извлечь тип сокета процессора, как вы можете видеть на следующем рисунке. Я определил, что тип сокета находится под &lt;h4&gt; Заголовок сокета, как показано на следующем рисунке. До сих пор я был в состоянии очистить .spec.block и найти в…
21 дек '18 в 07:51
1 ответ

Получить рендеринг строк JavaScript с веб-сайта в Python

Я использую Python 3.6.6 для этого. Я пытаюсь получить номер текущей версии pycharm с сайта pycharm ( https://www.jetbrains.com/pycharm/download/). Номер версии отображается довольно очевидно, но я не могу его получить, потому что не знаю, как прави…
2 ответа

Python - запросы к экрану

Я пытаюсь зайти на довольно сложный (на первый взгляд) сайт и сделать заказ. Не знал ни одного утверждения Python до начала проекта. После многих запусков и остановок вы успешно вошли в систему с помощью Applications_html/HTMLSession. Преодолели про…
17 июл '18 в 14:45
0 ответов

Python (Django) выполняет код в основном потоке

Я пытаюсь использовать request_html для анализа HTML-страницы, которая требует рендеринга JavaScript. И я обнаружил, что использование этой библиотеки (мое последнее пристанище) требует обработки ТОЛЬКО в основном потоке. Дело в том, что я получаю з…
0 ответов

Форма запроса отправки, без имени для изображения

Я пытаюсь отправить форму через запросы, но я не могу найти способ опубликовать изображение. Вот запросы браузера: -----------------------------20194539421983846218651111117 Content-Disposition: form-data; name="image_id" 968754 --------------------…
1 ответ

Python запрашивает HTML с Tor

Требование заключается в анонимном удалении или изменении IP после определенного количества звонков. Я использую https://github.com/kennethreitz/requests-html модуль для разбора HTML, но я получаю следующую ошибку, socks.SOCKS5Error: 0x01: General S…
1 ответ

Очистить веб-страницу <ul> <li> (Python)

Вопрос: Есть веб-сайт https://au.pcpartpicker.com/products/cpu/overall-list/ со списком &lt;li&gt; под &lt;ul&gt; каждый элемент в списке содержит &lt;div&gt; с названием класса в этом классе есть еще 2 &lt;div&gt; У элементов первый пример текста 3…