unicodeDecodeError при использовании сланца

У меня есть несколько PDF-файлов, из которых мне нужно извлечь информацию. Я использую Python на Centos 7 с библиотекой Python. В начале, шифер работает отлично. Но тогда мне нужно обновить несколько модулей и библиотек. Шиферная библиотека больше не работает. Чтобы решить эту проблему, я попытался обновить Slate и пытался использовать разные версии, но ни одна из них не работала. Ошибка:

File "/usr/lib64/python2.7/StringIO.py", line 271, in getvalue
self.buf += ''.join(self.buflist)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 58: ordinal not in range(128)`

Когда я снимаю планшет с моего кода, все работает просто отлично.

Кусок кода, который я использую Slate:

def adequacaoCut(pdf, person, pathInt, pathImg):
    with open('pdfs/'+pdf, 'rb') as f:
        doc = slate.PDF(f)
        print doc
        ... rest of code that works fine
  • Версия сланца: 0.5.2

  • Версия python:2.7

Со временем я уже не помню, какие библиотеки или обновления на python, centos или что я делал. Что я должен делать?

1 ответ

Решение

Я сам решаю проблему. Я обнаружил, что у меня есть два pdfminer на моем компьютере (pdfminer и pdfminer.six). Я думаю, что был какой-то конфликт между библиотеками, или Slate пытался вызвать pdfminer.six вместо pdfminer. Я удаляю оба и переустанавливаю только pdfminer. Теперь это работает как шарм.

Другие вопросы по тегам