pdftotext получить информацию о шрифте (семейство шрифтов, стиль, размер)
Я использую "pdftotext -bbox file.pdf
"чтобы преобразовать pdf
подать в HTML
,
Вот пример строки из вывода:
<word xMin="351.852025" yMin="42.548936" xMax="365.689478"
yMax="47.681498">foo</word>
Есть ли способ получить информацию о шрифте для каждого слова, как:
- семейство шрифтов, например, Verdana
- стиль, т.е. нет, жирный, курсив
- размер, например размер шрифта 9
Мне интересно знать, может ли это сделать poppler или xpdf версия pdftotext.