Описание тега pyquery

NonePyquery - это jquery-подобная библиотека для python, которая позволяет делать jquery-запросы к xml-документам.
1 ответ

Как вызвать событие, используя pyquery python

Я пытаюсь автоматизировать безголовый веб-браузер, используя python и такие пакеты, как pyquery, красивый суп, запросы, механизировать. Но до сих пор я не нашел правильного способа вызвать событие нажатия на кнопку. Например, чтобы заполнить онлайн-…
04 сен '16 в 07:38
1 ответ

Передача переменной в: содержит () селектор, pyquery/cssselect, ошибка

Я использую pyquery для очистки некоторых данных и хотел бы перебрать некоторые ключевые слова в сочетании с соответствующими регулярными выражениями. Я пытаюсь передать ключи как переменные, но получаю следующую ошибку: ExpressionError: Expected a …
30 ноя '15 в 14:39
1 ответ

Не удается извлечь результат, как ожидалось, при использовании request_html

Я не могу извлечь правильный результат с помощью request_html: >>> from requests_html import HTMLSession >>> session = HTMLSession() >>> r = session.get('https://www.amazon.com/dp/B07569DYGN') >>> r.html.find("#pr…
1 ответ

Использование PyQuery для запроса веб-страницы о результатах поиска по почтовому индексу

Я новее для сканирования данных. Теперь я должен использовать Pyquery для сканирования информации о школах в США по почтовому индексу на веб-сайте http://www.greatschools.org/find-schools Каждый раз, когда я набираю почтовый индекс, URL страницы пои…
01 июл '13 в 19:08
1 ответ

Анализ локальной и онлайновой HTML-страницы с использованием PyQuery в Python

Учитывая следующий URL: http://cisbp-rna.ccbr.utoronto.ca/TFreport.php?searchTF=T00022_0.6 Этот код не имеет проблем с его анализом: from pyquery import PyQuery as pq url= "http://cisbp-rna.ccbr.utoronto.ca/TFreport.php?searchTF=T00022_0.6" page = p…
22 дек '14 в 01:35
1 ответ

PyQuery - attr match возвращает только первое совпадение, а не все совпадения

При использовании pyquery я не получаю каждое совпадение для селектора только первым. Учитывая этот образец <?xml version="1.0" encoding="UTF-8"?> <meeting id="42736" barriertrial="0" venue="Rosehill Gardens" date="2016-03-19T00:00:00" gear…
17 апр '16 в 04:02
2 ответа

Как разобрать таблицу HTML, используя pyquery?

Как разобрать таблицу HTML, используя pyquery? [См. HTML-таблицу с исходным кодом на http://pastie.org/pastes/8556919 Результат: { "category_1": {"cat1_el1_label": "cat1_el1_value",}, "Category_2":{"cat2_el1_label":"cat2_el1_value"}, "Category_3": {…
16 дек '13 в 23:07
1 ответ

Конвертировать юникод со строкой utf-8 в качестве содержимого в str

Я использую pyquery для анализа страницы: dom = PyQuery('http://zh.wikipedia.org/w/index.php', {'title': 'CSS', 'printable': 'yes', 'variant': 'zh-cn'}) content = dom('#mw-content-text > p').eq(0).text() но что я получаю в content строка в кодиро…
26 янв '13 в 17:55
1 ответ

Разный вывод из одного и того же объекта PyQuery

Я использую scrapy, чтобы сканировать веб-сайт. with open('test.html', 'wb') as f: f.write(response.body) С этим блоком я пишу тело в файл. Когда я открываю файл, я вижу много тегов "a". Когда я печатаю то же самое с печатью. Он показывает только дв…
02 дек '15 в 21:31
1 ответ

pdfquery не возвращает значения в BBOX

Я пытаюсь вернуть текст в желаемом bbox pdf, используя библиотеку pdfquery. import pdfquery pdf = pdfquery.PDFQuery("C:/Users/tyler.cowan/Desktop/PDF Miner/test.pdf") test = pdf.extract([ ('UWI/API', 'LTTextLineHorizontal:in_bbox("35.28,700.56,127.4…
18 июл '17 в 16:42
2 ответа

PyQuery Как добавить и переименовать элемент в каждом из его подэлементов

Как я могу добавить или вставить атрибут класса в его подэлементы, но только для прямых потомков, а затем повторить для следующего класса и подэлементов. В документации здесь упоминается манипулирование пиком >>> d = pq('<html><bod…
22 апр '16 в 11:50
2 ответа

Как использовать Pyquery для изменения атрибута узла в Python

Я хочу использовать pyquery, чтобы сделать это. например: html='<div>arya stark<img src="1111"/>ahahah<img src="2222"/></div>' a=PyQuery(html) я хочу изменить HTML в <div>arya stark<img src="aaaa"/>ahahah<img s…
01 апр '11 в 19:40
1 ответ

Не в состоянии очистить изображения с pyspider и phantomjs

Теперь я хочу скрести все изображения предметов (iphone) на этой веб-странице. Сначала я извлекаю все ссылки изображения, а затем отправляю запрос src по одной и загружаю их в папку "/phone/". Вот мой код: from pyspider.libs.base_handler import * cl…
02 июн '16 в 11:19
1 ответ

Как читать данные JQuery с Python?

У меня есть большие данные JQuery в следующем формате. jQuery({locations: [,…], markersContent: [,…], sidebarContent: [,…]}); Есть ли способ получить контекст первой части (местоположения) с помощью Python? Я безуспешно пробовал разные команды в PyQ…
28 мар '17 в 13:31
3 ответа

Ошибка пипса: нераспознанная опция командной строки '-fstack-protector-strong'

Когда я sudo pip install pyquery, sudo pip install lxml, а также sudo pip install cythonЯ получаю очень похожий вывод с той же ошибкой, которая говорит: x86_64-linux-gnu-gcc: error: unrecognized command line option ‘-fstack-protector-strong’ Вот пол…
28 ноя '14 в 04:45
1 ответ

Рекламные объявления портят мою статью

Что мне нужно сделать, когда я пытаюсь сканировать статью, но ее объявления продолжают появляться? В частности, те, которые будут появляться в середине экрана с просьбой войти / зарегистрироваться, и вам придется вручную закрыть его перед чтением. И…
10 окт '14 в 23:58
1 ответ

pyquery (lxml) не находит тег в хорошо структурированном XML-документе?

У меня есть XML-файл, который выглядит следующим образом. Соответствующий бит это: <reference> <citation>Vander Wal JS, Gang CH, Griffing GT, Gadde KM. Escitalopram for treatment of night eating syndrome: a 12-week, randomized, placebo-c…
24 авг '16 в 16:46
1 ответ

Извлечение автора из статьи

Как следует из названия, я работал над сканированием статьи, и все, что осталось, - это автор. Ниже приведен мой код, использующий pyquery для компиляции абзацев и автора, причем только автор возвращает пустое сайт цели: http://business.transworld.n…
01 окт '14 в 00:05
1 ответ

Удалите все скрытые элементы в HTML, используя Pyquery в Python

У меня есть кусок HTML-кода, где я должен удалить скрытые элементы из него. Я пробовал следующий код from pyquery import PyQuery html_data = ''' <div style="display: none;">This is a hidden div.</div> <p>This is another paragraph.&…
05 фев '18 в 05:35
1 ответ

Как использовать Pyquery со скрапом?

Моя цель - использовать pyquery со scrapy, как видно из scrapy.selector import PyQuerySelector возвращает ImportError: невозможно импортировать имя PyQuerySelector при сканировании паука. Я следовал этой конкретной идее https://gist.github.com/joehi…
21 янв '14 в 10:06