unicodeDecodeError при использовании сланца
У меня есть несколько PDF-файлов, из которых мне нужно извлечь информацию. Я использую Python на Centos 7 с библиотекой Python. В начале, шифер работает отлично. Но тогда мне нужно обновить несколько модулей и библиотек. Шиферная библиотека больше не работает. Чтобы решить эту проблему, я попытался обновить Slate и пытался использовать разные версии, но ни одна из них не работала. Ошибка:
File "/usr/lib64/python2.7/StringIO.py", line 271, in getvalue
self.buf += ''.join(self.buflist)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 58: ordinal not in range(128)`
Когда я снимаю планшет с моего кода, все работает просто отлично.
Кусок кода, который я использую Slate:
def adequacaoCut(pdf, person, pathInt, pathImg):
with open('pdfs/'+pdf, 'rb') as f:
doc = slate.PDF(f)
print doc
... rest of code that works fine
Версия сланца: 0.5.2
Версия python:2.7
Со временем я уже не помню, какие библиотеки или обновления на python, centos или что я делал. Что я должен делать?
1 ответ
Я сам решаю проблему. Я обнаружил, что у меня есть два pdfminer на моем компьютере (pdfminer и pdfminer.six). Я думаю, что был какой-то конфликт между библиотеками, или Slate пытался вызвать pdfminer.six вместо pdfminer. Я удаляю оба и переустанавливаю только pdfminer. Теперь это работает как шарм.