Разный вывод из одного и того же объекта PyQuery

Я использую scrapy, чтобы сканировать веб-сайт.

with open('test.html', 'wb') as f:
        f.write(response.body)

С этим блоком я пишу тело в файл. Когда я открываю файл, я вижу много тегов "a".

Когда я печатаю то же самое с печатью. Он показывает только два тега "а"

print response.body

Ты хоть представляешь, что здесь происходит?

1 ответ

Решение

Я решил проблему. У просканированного сайта есть второй <html> тег в выпадающем списке.

Я использовал PyQuery, и если есть какие-либо проблемы с тегами в структуре HTML, PyQuery не работает.

Теперь я изменил свой селектор на xpath, и теперь он находит все теги в HTML.

Другие вопросы по тегам