Извлечение текста (изображения) Брайля из PDF с помощью iTextSharp

Question

Извлечение текста (изображения) Брайля из PDF с помощью iTextSharp

Брайль - это особый шрифт для слепых. Я пытаюсь декодировать текст, написанный шрифтом Брайля, в файл PDF и выводить обычный текст. Но PDFTextExtractor (в iTextSharp) не может обработать этот шрифт. Возможно ли это по-другому?

Я пытаюсь выяснить, как я могу декодировать из файла PDF.

Я пытался использовать,

PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);

this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();

для файла PDF, содержащего текст обычным шрифтом (например, Arial) и шрифтом Брайля, но он не возвращает текст Брайля и вместо этого возвращает только обычный текст на странице.

Как я могу получить текст шрифта Брайля вместо этого, используя iTextSharp.

1

pdf itext extract itextsharp braille

Источник

user555467 07 авг '11 в 11:04

1 ответ

Решение

Другие вопросы по тегам pdf itext extract itextsharp braille

user231316 09 авг '11 в 15:55 2011-08-09 15:55 · Accepted Answer · 2011-08-09 15:55

(пока нет ответа)

Ладно, может я не правильно понимаю. Я просто пытался использовать PdfTextExtractor на PDF, который вы предоставили, и он работал правильно. В частности, следующий текст был вычеркнут для страницы 1:

B   r    a   i     l    l    e   C   o   d    e   s 
B r a i l l e C o d e s 

Embossed dot positions as,   


A  B   C   D   E   F   G  H   I    J   K  
A B C D E F G H I J K 
L    M  N  O   P  Q   R  S   T   U   V  
L M N O P Q R S T U V 
W  X   Y   Z 
W X Y Z 


1   2   3    4   5   6    7   8   9   0 
1 2 3 4 5 6 7 8 9 0

Я прошу прощения, если я неправильно вас понимаю, но вы пытаетесь вернуть текст как Брайля?