Как извлечь URL, на котором сейчас находится мой сканер?
Я делаю веб-сканер с использованием Scrapy Framework в Python. Основная идея заключается в том, что сканер извлекает некоторые данные со страницы, если данные соответствуют некоторым критериям, сканер должен извлечь URL-адрес, на котором он находится в данный момент. Есть ли какой-нибудь метод / функция в scrappy, который получает текущий URL?
Благодарю.
1 ответ
Решение
Переменная 'response', передаваемая parse(), содержит информацию, которую вы хотите. Вам не нужно ничего переопределять.
например.
def parse(self, response):
print "URL: " + response.url