pdftotext получить информацию о шрифте (семейство шрифтов, стиль, размер)

Я использую "pdftotext -bbox file.pdf"чтобы преобразовать pdf подать в HTML,

Вот пример строки из вывода:

<word xMin="351.852025" yMin="42.548936" xMax="365.689478"
yMax="47.681498">foo</word>

Есть ли способ получить информацию о шрифте для каждого слова, как:

  • семейство шрифтов, например, Verdana
  • стиль, т.е. нет, жирный, курсив
  • размер, например размер шрифта 9

Мне интересно знать, может ли это сделать poppler или xpdf версия pdftotext.

0 ответов

Другие вопросы по тегам