Метаданные XMP из Pdf с использованием PdfSharp

Я хочу прочитать метаданные XMP из документов PDF. Я пытался прочитать данные с помощью PDFsharp ( http://www.pdfsharp.net/). Большую часть времени это работало хорошо, но в некоторых случаях я получаю это исключение:

Unhandled Exception: PdfSharp.Pdf.IO.PdfReaderException: Cannot handle iref streams. The current implementation of PDFsharp cannot handle this PDF feature introduced with Acrobat 6.

Я где-то читал, что этого не происходит в новой версии. Поэтому я скачал PdfSharp 1.50.3638-бета ( https://www.nuget.org/packages/PdfSharp/1.50.3638-beta).

И да, теперь я не исключение. Но моя новая проблема заключается в том, что функция PdfReader.open не работает с некоторыми документами. Это означает, что программа никогда не покидает функцию.

На некоторых форумах я читал, что это может быть вызвано большими документами с большим количеством изображений. Поэтому я попытался прочитать только информацию документа:

PdfDocument pd = PdfReader.Open(s, PdfDocumentOpenMode.InformationOnly);

Но это все еще не работает. Некоторые идеи, как я могу читать метаданные?

1 ответ

Поддержка потоков IRef является новой для бета-версии PDFsharp 1.50, и если у вас есть файл, который невозможно прочитать, отправьте его на экспертизу.

Другие вопросы по тегам