Разный вывод из одного и того же объекта PyQuery
Я использую scrapy, чтобы сканировать веб-сайт.
with open('test.html', 'wb') as f:
f.write(response.body)
С этим блоком я пишу тело в файл. Когда я открываю файл, я вижу много тегов "a".
Когда я печатаю то же самое с печатью. Он показывает только два тега "а"
print response.body
Ты хоть представляешь, что здесь происходит?
1 ответ
Решение
Я решил проблему. У просканированного сайта есть второй <html>
тег в выпадающем списке.
Я использовал PyQuery, и если есть какие-либо проблемы с тегами в структуре HTML, PyQuery не работает.
Теперь я изменил свой селектор на xpath, и теперь он находит все теги в HTML.