Описание тега scrapy-shell

Оболочка Scrapy - это интерактивная оболочка, в которой вы можете очень быстро попытаться отладить код очистки без необходимости запускать паук.
2 ответа

Я получил TypeError при использовании Scrapy View

Я пытаюсь использовать scrapy view https://www.example.com (не настоящая ссылка, так как мне не разрешено раскрывать ее по моей работе. Извините.) для отладки ссылки, но затем я получил эту ошибку. 2018-11-01 20:49:29 [twisted] CRITICAL: Unhandled e…
1 ответ

Как вычеркнуть названия продуктов с веб-сайта, используя оболочку Scrapy

Пожалуйста, помогите мне найти названия продуктов по этой ссылке: http://www.gap.com/browse/category.do?cid=5168&scrollTo;=product353401012&scrollTo;=product353401012 Имена продуктов содержатся в class="product-card- name", который находится в div. …
05 дек '16 в 14:46
2 ответа

Как выбрать все атрибуты href в теге html содержат общий класс. в скрапе

Я хочу выбрать все href, содержащиеся в теге... вот мой HTML-код <a href="/gp/product/0545935172 ...." class="aok-block aok-nowrap" title="Dog Man: Lord of the Fleas: From the Creator of Captain Underpants (Dog Man #5)"> я использовал response…
27 ноя '18 в 01:34
1 ответ

Не могу войти используя Scrapy

<div class="col small-w100 tiny-w100 col1"> <div class="box_already_member"> <h2 class="fs22 fwn foro black">Already member ?</h2> <p>Please enter your account details : </p> <div class="box_form"> <label…
04 июн '18 в 10:23
1 ответ

Как извлечь раздел через xpath из исходного кода в scrapy?

Я пытаюсь извлечь текст из исходного кода сайта в разделе. Исходный код сайта, который я пытаюсь извлечь, выглядит следующим образом: if ('function' === typeof window.ToggleFilters) { window.ToggleFilters(); } </script> <main id="main" data…
09 фев '19 в 21:35
1 ответ

Почему это противоречивое поведение при использовании результатов печати с использованием шелухи?

Загрузите скорлупу scrapy shell "http://www.worldfootball.net/all_matches/eng-premier-league-2015-2016/" Попробуйте селектор: response.xpath('(//table[@class="standard_tabelle"])[1]/tr[not(th)]') Примечание: он печатает результаты. Но теперь использ…
2 ответа

Как использовать оболочку Scrapy с URL-адресом и базовыми учетными данными?

Я хочу использовать scrapy shell и проверьте данные ответа для URL, который требует базовых учетных данных. Я попытался проверить документацию оболочки Scrapy, но я не смог найти ее там. Я пробовал с scrapy shell 'http://user:pwd@abc.com' но это не …
0 ответов

"Пауза / возобновление" Scrapy стала "пауза / перезапуск"

Вот вещьВот большой список слов. Я хочу сканировать некоторые данные по этим словам. Это отнимает много времени, поэтому я хотел бы разбить его на куски. Сначала я загружаю список слов в список в __init__ моего паука. def __init__(self, category=Non…
02 авг '17 в 17:56
1 ответ

Scrapy - другой контент страницы при загрузке response.body

Я пытаюсь разобрать страницу, например www.page.com/results?sort=price, Я анализирую это с этим кодом: def start_requests(self): start_urls = [ "www.page.com/results?sort=price", ] for url in start_urls: yield scrapy.Request(url=url, callback=self.p…
05 май '18 в 23:08
0 ответов

Response.css() не дает результатов для разбиения на страницы в сканере scrapy после входа в систему

Я хочу прочитать "название" списка проектов, которые находятся на нумерации страниц и почти 335 записей. То, что я пытаюсь сделать, это: 1) Сначала я получаю ответ браузера с помощью этой команды в Windows CMD: scrapy shell https://www.slingshotinsi…
02 ноя '17 в 11:07
1 ответ

scrapy1.1 просканировал 0 страниц, но я могу получить данные с помощью команды scrapy shell

Я пытался изучить учебник Scrapy, и после запуска команды на верхнем уровне проекта я получил следующий вывод: 2016-07-05 21:06:01 [scrapy] INFO: Scrapy 1.1.0 started (bot: tutorial) 2016-07-05 21:06:01 [scrapy] INFO: Overridden settings: {'NEWSPIDE…
05 июл '16 в 13:39
1 ответ

Вызвать пользовательский экспортер scrapy из командной строки

Пытаясь решить мою проблему (вывести упорядоченный массив Json по полю определенного элемента), я получил ответ, в котором предлагается создать собственный экспортер для работы. Я создаю один, но... все примеры, которые я нашел, предлагают вызывать …
0 ответов

Разве мы не можем использовать скорлупу в клетке ноутбука Юпитера?

(система win10) Как я пытался выполнить эти коды в ячейке ноутбука jupyter:! Scrapy shell ' http://www.baidu.com/' это приходит с : ValueError: неверное имя хоста: 'http Таким образом, я попытался выполнить: !scrapy shell “http://www.baidu.com” (дво…
24 авг '18 в 02:11
1 ответ

Как извлечь текст с помощью Xpath в Scrapy?

Хорошо, похоже, что я все перепробовал и просто не могу понять, что здесь происходит. Прямая ссылка на сайт, который я пытаюсь почистить, находится по http://www.ammofast.com/collections/pistol/products/aguila-25-auto-acp-full-metal-jacket-50-gr-100…
02 июн '16 в 18:37
0 ответов

Ошибка scrapy key: z (freebsd)

Я пытаюсь установить scrapy 0.24 в системе freebsd (MariaDB), но когда я пытаюсь запустить его, у меня появляется "keyError: 'z'", который я не знаю, что это значит... Я пытался отладить его безуспешно, File "/usr/local/bin/scrapy", line 9, in <m…
24 янв '15 в 19:51
1 ответ

Scrapy Amazon абсолютный путь, но без возврата стоимости

Я пытаюсь использовать Scrapy некоторую информацию с amazon.co.uk, используя абсолютный путь, как показано ниже. но, как ни странно, значение не возвращается. Я совершенно новичок в Scrapy: scrapy shell http://www.amazon.co.uk/product-reviews/B0042E…
28 апр '15 в 22:54
1 ответ

Почему скрап-печать \t\n\n там, где я ожидаю, что там будет текст?

Я новичок в области скрапа, но учусь. Я анализировал эту страницу. и пытаюсь соскрести адрес со страницы. Я сделал это в оболочке Scrapy, поэтому я начну с: scrapy shell https://www.marksandspencer.com/MSStoreDetailsView?storeId=10151&langId=-24…
17 дек '17 в 19:15
0 ответов

Scrapy Shell имеет правильный вывод, но скрипт не

Так что я очень смущен здесь. Когда я использую оболочку scrapy и ввожу xpath, возвращаются правильные данные, но когда я устанавливаю тот же самый xpath равным переменной в скрипте, он выводит пробел. Я действительно не уверен, что происходит. impo…
07 июл '17 в 21:05
2 ответа

Не удается получить ссылку на изображение с помощью XPath

Я использую Scrapy для сканирования ссылки на изображение продукта на этом сайте: http://eshop.tesco.com.my/en-GB/Promotion/List?SortBy=Default По некоторым причинам Xpath не захватывает ссылки src изображения продукта. Я попытался отсканировать все…
11 дек '15 в 12:19
1 ответ

scrapy xpath выбрать элементы по имени класса

Я следил Как я могу найти элемент по классу CSS с XPath? который дает селектор для выбора элементов по имени класса. Проблема в том, что когда я его использую, он получает пустой результат "[]", и я знаю, что в URL-адресе, передаваемом в оболочку sc…
27 янв '15 в 15:53