Описание тега pyquery
NonePyquery - это jquery-подобная библиотека для python, которая позволяет делать jquery-запросы к xml-документам.
1
ответ
Как вызвать событие, используя pyquery python
Я пытаюсь автоматизировать безголовый веб-браузер, используя python и такие пакеты, как pyquery, красивый суп, запросы, механизировать. Но до сих пор я не нашел правильного способа вызвать событие нажатия на кнопку. Например, чтобы заполнить онлайн-…
04 сен '16 в 07:38
1
ответ
Передача переменной в: содержит () селектор, pyquery/cssselect, ошибка
Я использую pyquery для очистки некоторых данных и хотел бы перебрать некоторые ключевые слова в сочетании с соответствующими регулярными выражениями. Я пытаюсь передать ключи как переменные, но получаю следующую ошибку: ExpressionError: Expected a …
30 ноя '15 в 14:39
1
ответ
Не удается извлечь результат, как ожидалось, при использовании request_html
Я не могу извлечь правильный результат с помощью request_html: >>> from requests_html import HTMLSession >>> session = HTMLSession() >>> r = session.get('https://www.amazon.com/dp/B07569DYGN') >>> r.html.find("#pr…
08 окт '18 в 09:41
1
ответ
Использование PyQuery для запроса веб-страницы о результатах поиска по почтовому индексу
Я новее для сканирования данных. Теперь я должен использовать Pyquery для сканирования информации о школах в США по почтовому индексу на веб-сайте http://www.greatschools.org/find-schools Каждый раз, когда я набираю почтовый индекс, URL страницы пои…
01 июл '13 в 19:08
1
ответ
Анализ локальной и онлайновой HTML-страницы с использованием PyQuery в Python
Учитывая следующий URL: http://cisbp-rna.ccbr.utoronto.ca/TFreport.php?searchTF=T00022_0.6 Этот код не имеет проблем с его анализом: from pyquery import PyQuery as pq url= "http://cisbp-rna.ccbr.utoronto.ca/TFreport.php?searchTF=T00022_0.6" page = p…
22 дек '14 в 01:35
1
ответ
PyQuery - attr match возвращает только первое совпадение, а не все совпадения
При использовании pyquery я не получаю каждое совпадение для селектора только первым. Учитывая этот образец <?xml version="1.0" encoding="UTF-8"?> <meeting id="42736" barriertrial="0" venue="Rosehill Gardens" date="2016-03-19T00:00:00" gear…
17 апр '16 в 04:02
2
ответа
Как разобрать таблицу HTML, используя pyquery?
Как разобрать таблицу HTML, используя pyquery? [См. HTML-таблицу с исходным кодом на http://pastie.org/pastes/8556919 Результат: { "category_1": {"cat1_el1_label": "cat1_el1_value",}, "Category_2":{"cat2_el1_label":"cat2_el1_value"}, "Category_3": {…
16 дек '13 в 23:07
1
ответ
Конвертировать юникод со строкой utf-8 в качестве содержимого в str
Я использую pyquery для анализа страницы: dom = PyQuery('http://zh.wikipedia.org/w/index.php', {'title': 'CSS', 'printable': 'yes', 'variant': 'zh-cn'}) content = dom('#mw-content-text > p').eq(0).text() но что я получаю в content строка в кодиро…
26 янв '13 в 17:55
1
ответ
Разный вывод из одного и того же объекта PyQuery
Я использую scrapy, чтобы сканировать веб-сайт. with open('test.html', 'wb') as f: f.write(response.body) С этим блоком я пишу тело в файл. Когда я открываю файл, я вижу много тегов "a". Когда я печатаю то же самое с печатью. Он показывает только дв…
02 дек '15 в 21:31
1
ответ
pdfquery не возвращает значения в BBOX
Я пытаюсь вернуть текст в желаемом bbox pdf, используя библиотеку pdfquery. import pdfquery pdf = pdfquery.PDFQuery("C:/Users/tyler.cowan/Desktop/PDF Miner/test.pdf") test = pdf.extract([ ('UWI/API', 'LTTextLineHorizontal:in_bbox("35.28,700.56,127.4…
18 июл '17 в 16:42
2
ответа
PyQuery Как добавить и переименовать элемент в каждом из его подэлементов
Как я могу добавить или вставить атрибут класса в его подэлементы, но только для прямых потомков, а затем повторить для следующего класса и подэлементов. В документации здесь упоминается манипулирование пиком >>> d = pq('<html><bod…
22 апр '16 в 11:50
2
ответа
Как использовать Pyquery для изменения атрибута узла в Python
Я хочу использовать pyquery, чтобы сделать это. например: html='<div>arya stark<img src="1111"/>ahahah<img src="2222"/></div>' a=PyQuery(html) я хочу изменить HTML в <div>arya stark<img src="aaaa"/>ahahah<img s…
01 апр '11 в 19:40
1
ответ
Не в состоянии очистить изображения с pyspider и phantomjs
Теперь я хочу скрести все изображения предметов (iphone) на этой веб-странице. Сначала я извлекаю все ссылки изображения, а затем отправляю запрос src по одной и загружаю их в папку "/phone/". Вот мой код: from pyspider.libs.base_handler import * cl…
02 июн '16 в 11:19
1
ответ
Как читать данные JQuery с Python?
У меня есть большие данные JQuery в следующем формате. jQuery({locations: [,…], markersContent: [,…], sidebarContent: [,…]}); Есть ли способ получить контекст первой части (местоположения) с помощью Python? Я безуспешно пробовал разные команды в PyQ…
28 мар '17 в 13:31
3
ответа
Ошибка пипса: нераспознанная опция командной строки '-fstack-protector-strong'
Когда я sudo pip install pyquery, sudo pip install lxml, а также sudo pip install cythonЯ получаю очень похожий вывод с той же ошибкой, которая говорит: x86_64-linux-gnu-gcc: error: unrecognized command line option ‘-fstack-protector-strong’ Вот пол…
28 ноя '14 в 04:45
1
ответ
Рекламные объявления портят мою статью
Что мне нужно сделать, когда я пытаюсь сканировать статью, но ее объявления продолжают появляться? В частности, те, которые будут появляться в середине экрана с просьбой войти / зарегистрироваться, и вам придется вручную закрыть его перед чтением. И…
10 окт '14 в 23:58
1
ответ
pyquery (lxml) не находит тег в хорошо структурированном XML-документе?
У меня есть XML-файл, который выглядит следующим образом. Соответствующий бит это: <reference> <citation>Vander Wal JS, Gang CH, Griffing GT, Gadde KM. Escitalopram for treatment of night eating syndrome: a 12-week, randomized, placebo-c…
24 авг '16 в 16:46
1
ответ
Извлечение автора из статьи
Как следует из названия, я работал над сканированием статьи, и все, что осталось, - это автор. Ниже приведен мой код, использующий pyquery для компиляции абзацев и автора, причем только автор возвращает пустое сайт цели: http://business.transworld.n…
01 окт '14 в 00:05
1
ответ
Удалите все скрытые элементы в HTML, используя Pyquery в Python
У меня есть кусок HTML-кода, где я должен удалить скрытые элементы из него. Я пробовал следующий код from pyquery import PyQuery html_data = ''' <div style="display: none;">This is a hidden div.</div> <p>This is another paragraph.&…
05 фев '18 в 05:35
1
ответ
Как использовать Pyquery со скрапом?
Моя цель - использовать pyquery со scrapy, как видно из scrapy.selector import PyQuerySelector возвращает ImportError: невозможно импортировать имя PyQuerySelector при сканировании паука. Я следовал этой конкретной идее https://gist.github.com/joehi…
21 янв '14 в 10:06