Извлечение текста (изображения) Брайля из PDF с помощью iTextSharp
Брайль - это особый шрифт для слепых. Я пытаюсь декодировать текст, написанный шрифтом Брайля, в файл PDF и выводить обычный текст. Но PDFTextExtractor (в iTextSharp) не может обработать этот шрифт. Возможно ли это по-другому?
Я пытаюсь выяснить, как я могу декодировать из файла PDF.
Я пытался использовать,
PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);
this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();
для файла PDF, содержащего текст обычным шрифтом (например, Arial) и шрифтом Брайля, но он не возвращает текст Брайля и вместо этого возвращает только обычный текст на странице.
Как я могу получить текст шрифта Брайля вместо этого, используя iTextSharp.
1 ответ
(пока нет ответа)
Ладно, может я не правильно понимаю. Я просто пытался использовать PdfTextExtractor
на PDF, который вы предоставили, и он работал правильно. В частности, следующий текст был вычеркнут для страницы 1:
B r a i l l e C o d e s
B r a i l l e C o d e s
Embossed dot positions as,
A B C D E F G H I J K
A B C D E F G H I J K
L M N O P Q R S T U V
L M N O P Q R S T U V
W X Y Z
W X Y Z
1 2 3 4 5 6 7 8 9 0
1 2 3 4 5 6 7 8 9 0
Я прошу прощения, если я неправильно вас понимаю, но вы пытаетесь вернуть текст как Брайля?