Как использовать оболочку Scrapy с URL-адресом и базовыми учетными данными?

Question

Как использовать оболочку Scrapy с URL-адресом и базовыми учетными данными?

Я хочу использовать scrapy shell и проверьте данные ответа для URL, который требует базовых учетных данных. Я попытался проверить документацию оболочки Scrapy, но я не смог найти ее там.

Я пробовал с scrapy shell 'http://user:pwd@abc.com' но это не сработало. Кто-нибудь знает, как мне этого добиться?

11

python-2.7 scrapy web-crawler basic-authentication scrapy-shell

Источник

user4622470 16 мар '17 в 02:26

2 ответа

Решение

Да, с промежуточным ПО httpauth.

Убедитесь, что HTTPAuthMiddleware включен в настройках, а затем просто определите:

class MySpider(CrawSpider):
    http_user = 'username'
    http_pass = 'password'
    ...

как переменные класса в вашем пауке.

Кроме того, вам не нужно указывать учетные данные для входа в URL, если промежуточное ПО было включено в настройках.

6

Источник

user1028237 16 мар '17 в 02:46

Другие вопросы по тегам python-2.7 scrapy web-crawler basic-authentication scrapy-shell

user858913 16 мар '17 в 02:57 2017-03-16 02:57 · Accepted Answer · 2017-03-16 02:57

Если вы хотите использовать только оболочку, вы можете сделать что-то вроде этого:

$ scrapy shell

и внутри оболочки:

>> from w3lib.http import basic_auth_header
>> from scrapy import Request
>> auth = basic_auth_header(your_user, your_password)
>> req = Request(url="http://example.com", headers={'Authorization': auth})
>> fetch(req)

как fetch использует текущий запрос для обновления сеанса оболочки.