Чтобы получить определенные данные, извлеченные из PDF, с помощью Python

Question

Чтобы получить определенные данные, извлеченные из PDF, с помощью Python

Я хочу извлечь номер мобильного телефона и адрес электронной почты из PDF-файла с резюме. Я создаю программу. Я могу извлекать данные из PDF, но я могу извлечь из данных только номер мобильного телефона, я не могу извлечь электронную почту. Идентификационная информация из данных. Когда я набираю тот же код, который написал для получения номера мобильного телефона, я не могу его получить. Я использовал метод pdfplumber для извлечения данных из pdf. Я написал код ниже:

      import pdfplumber
pdf_file_na= "Converted\doc2pdfconverted.pdf"
with pdfplumber.open(pdf_file_na) as pdf:
    page = pdf.pages[0]
    text = page.extract_text()
for row in text.split('\n'):
    if row.startswith('Mobile:'):
        mobile = row.split()[-1]
        mobile

но когда я пишу тот же код для электронной почты, я не получаю вывода, программа работает нормально без каких-либо ошибок, но я не получаю никаких результатов.

      import pdfplumber
    pdf_file_na= "Converted\doc2pdfconverted.pdf"
    with pdfplumber.open(pdf_file_na) as pdf:
        page = pdf.pages[0]
        text = page.extract_text()
    for row in text.split('\n'):
        if row.startswith('Email:'):
            email= row.split()[-1]
            email

Я прошу вас помочь мне с этим. Заранее спасибо.

Если у вас есть какие-либо другие методы или другие библиотечные методы, пожалуйста, напишите.

-1

python pdf data-extraction pdfplumber

Источник

user16135436 13 июн '21 в 21:09

0 ответов

Другие вопросы по тегам python pdf data-extraction pdfplumber