Чтобы получить определенные данные, извлеченные из PDF, с помощью Python
Я хочу извлечь номер мобильного телефона и адрес электронной почты из PDF-файла с резюме. Я создаю программу. Я могу извлекать данные из PDF, но я могу извлечь из данных только номер мобильного телефона, я не могу извлечь электронную почту. Идентификационная информация из данных. Когда я набираю тот же код, который написал для получения номера мобильного телефона, я не могу его получить. Я использовал метод pdfplumber для извлечения данных из pdf. Я написал код ниже:
import pdfplumber
pdf_file_na= "Converted\doc2pdfconverted.pdf"
with pdfplumber.open(pdf_file_na) as pdf:
page = pdf.pages[0]
text = page.extract_text()
for row in text.split('\n'):
if row.startswith('Mobile:'):
mobile = row.split()[-1]
mobile
но когда я пишу тот же код для электронной почты, я не получаю вывода, программа работает нормально без каких-либо ошибок, но я не получаю никаких результатов.
import pdfplumber
pdf_file_na= "Converted\doc2pdfconverted.pdf"
with pdfplumber.open(pdf_file_na) as pdf:
page = pdf.pages[0]
text = page.extract_text()
for row in text.split('\n'):
if row.startswith('Email:'):
email= row.split()[-1]
email
Я прошу вас помочь мне с этим. Заранее спасибо.
Если у вас есть какие-либо другие методы или другие библиотечные методы, пожалуйста, напишите.