Запросы-HTML Enconding error

Question

Запросы-HTML Enconding error

Привет ребята,

Когда я запускаю этот код:

from requests_html import HTMLSession

url = 'http://www.spell.org.br/documentos/resultadobusca/?eou%5B%5D=&tipo_busca=simples&campo%5B%5D=RESUMO&texto%5B%5D='\
  + parsekeyword(keyword) +\
  '&eou%5B%5D=E&campo%5B%5D=TITULO&texto%5B%5D=&eou%5B%5D=E&campo%5B%5D=TITULO&texto%5B%5D=&mes_inicio=&ano_inicio=&mes_fim=&ano_fim=&qtd_reg_pagina=20&pagina=2'

session = HTMLSession()
link = session.get(url)

linkslist = list(link.html.absolute_links)

Я получаю это сообщение об ошибке:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc3 in position 91835: invalid continuation byte

Я думаю, что это из-за не utf-8 символов в некоторых ссылках.

Поскольку это происходит внутри метода, есть ли способ справиться с этим?

Я начинающий, извините, если я пропустил что-то очевидное.

0

python python-3.x web-scraping character-encoding python-requests-html

Источник

user8598614 14 мар '18 в 01:26

1 ответ

Другие вопросы по тегам python python-3.x web-scraping character-encoding python-requests-html

user8795087 14 мар '18 в 06:21 2018-03-14 06:21 · Answer 1 · 2018-03-14 06:21

В python3 и запросах вы можете использовать response.content.decode('utf-8'), response переменная означает ваше link переменная

1

Источник

user8795087 14 мар '18 в 06:21

user13114375 15 июл '20 в 15:45 2020-07-15 15:45 · Answer 2 · 2020-07-15 15:45

У меня такая же проблема. Я выполнил следующую команду, и проблема была решена.

pip uninstall requests-html
pip install requests-html

0

Источник

user13114375 15 июл '20 в 15:45