Чтение текстового файла возвращает UnicodeDecodeError: кодек "utf-8" не может декодировать байт 0x92 в Python

Я читаю текстовый файл, используя Python3, даже я упомянул encoding но он возвращается:

UnicodeDecodeError: кодек "utf-8" не может декодировать байт 0x92 в позиции 96: недопустимый начальный байт [05/May/2018 03:35:45] "POST /app/ HTTP/1.1" 500 14383

Это не дубликат, но это специфично для byte 0x92,

Вот что я попробовал:

txt = Path(text_path).read_text(encoding="utf-8")

2 ответа

Решение

Ваш текстовый файл, вероятно, не закодирован в utf-8. Вы можете попробовать другую кодировку, например encoding='cp1252'

Согласно ответу Exceen на связанный вопрос, это "умная цитата" в кодировке Win-1252.

Другие вопросы по тегам