Как прочитать данные из PDF документа и вставить в базу данных?
Я получил PDF-документ от клиента. Документ длиной 60 страниц. Мне нужно прочитать данные с середины страницы 49 на страницу 58. В ColdFusion есть cfpdf
тег, который позволяет читать документы в формате PDF. Вот пример того, что я имею до сих пор:
<cftry>
<cfset mypdf = expandPath("./data.pdf")>
<cfpdf action="read" source="#mypdf#" name="PDFInfo">
<cfdump var="#PDFInfo#">
<cfcatch type="any">
<cfdump var="#cfcatch#">
</cfcatch>
</cftry>
После того, как документ выгружен на экран, появляется такая информация:
Author [empty string]
CenterWindowOnScreen no
ChangingDocument Allowed
Commenting Allowed
ContentExtraction Allowed
CopyContent Allowed
PageSizes
PDFDocumentarray
1
PDFDocument - struct
height 792
width 612
2
PDFDocument - struct
height 792
width 612
3
PDFDocument - struct
height 792
width 612
4
PDFDocument - struct
height 792
width 612
Я никогда прежде не использовал cfpdf, и это что-то новое для меня. Я попытался выполнить поиск в Интернете, но не смог найти пример того, как я могу получить данные из PDF-документа. Есть ли хороший способ получить данные с определенных страниц в файле / документе? Также я предполагаю, что должен быть цикл, который позволит получить доступ к отдельным данным строки. Если у кого-нибудь есть хороший пример ресурса по этой проблеме, пожалуйста, дайте мне знать. Благодарю.