Я не получаю нужный текст из метода извлечения текста PyPDF2

На первой странице моего PDF-файла указаны имя и дата рождения кандидата в этом формате.

Изображение текста, который мне нужно извлечь

Я использую следующий код для извлечения информации в python

import PyPDF2
pFile = open('MMout.pdf','rb')
pdfReadr = PyPDF2.PdfFileReader(pFile)
pageObj = pdfReadr.getPage(0)
pageObj.extractText()

Имя PDF-файла - MMOut.pdf.

Результатом приведенного выше кода является

'!!!!!"#$%!&\'()*+,-!.$#/+\',/!0&.1!2)#%\'\n!!!"#$%%&!!!!!!"#$%&\'()*(!+,-./0(.12.304!.\n(05"6"7\n(8&9:(!#&:"(;<=\n(25>7%#7\n(?@(/5"6%7$:>\n(?)(,%&A&B>\n(C@(0D0EF\n(GH(IJ$%&\'JA(!"#$%&\'(EK":JB"\n(?L(!"#$%&\'(L*(+IM.3!0EIM4IN(DO(2.MENDN4/EF(23E/04/.!\n(05"6"7\n(8&9:(!#&:"(;<=\n(2"PJB&B%#JA(Q"$5&P7(J\'P(3"7&9:#"7\n(R?(!$9P"\'$(E77"776"\'$(\nS(29:T&7"U(Q"$5&P7(J\'P(3"6"P%J$%&\'(\n(H(0D0EF\n(LR(IJ$%&\'JA(!"#$%&\'(EK":JB"\n(LV(((!"#$%&\'(?*(/DQQ+I4/E04DI\n(05"6"7\n(8&9:(!#&:"(;<=\n((FJ\'B9JB"U(N:J66J:(J\'P(!$:9#$9:"\n!LG((.WT:"77%&\'U(/AJ:%$>(J\'P(!"\'7%$%K%$>\n()G((0D0EF\n(LH((IJ$%&\'JA(!"#$%&\'(EK":JB"\n(?X(!"#$%$"&\'()"*\'+(\n!""#$%&\'()#\n(,"&\'(-.(/%0&1+\n(*+,-.,-//*(2\'3&(20"45+\n(0\'112"%34)552%34\'"64"%7862\'6"%9"$4)\'6:;\n(2\'3&(,"&\'+\n(-.,*<,.*.*!!"#$%&\'()*+,%-"-(."*"($*"(/$\'"-(+0(%01+*2$#%+0(\n)*+,%-"-(/3(#."(4$0-%-$#"($\'()"*(.%\'5."*(6+,"*02"0#(%\'\'7"-(%-"0#%#3()*++18(90\'#%#7#%+0\'(\n\'.+7&-(,"*%13(+*%6%0$&(*"4+*-\'(:.%&"($\'\'"\'\'%06(#."(4$0-%-$#"8\n(!$#"(+1(9\'\'7";(\n(!!<$&%-%#3(+1(=")+*#;(>(3"$*\'(1*+2(-$#"(+1(%\'\'7"8\n('

Я не могу найти нужный текст. Пожалуйста, помогите мне исправить, где я делаю не так, или если нужна другая информация.

0 ответов

Другие вопросы по тегам