PDF манипулирование - пометка изображения или фигуры
У меня есть исходный pdf(untagged.pdf), из которого я буду создавать теговую версию (tagged.pdf)
У меня есть информация обо всех тегах HTML всего содержимого исходного PDF.
Теперь у меня есть рисунок на странице 3. Когда я анализирую программно, это не будет обнаружено как изображение, но это прямоугольник с некоторым текстом и другим прямоугольником, как показано ниже.
_____________________ ____________________
| Some text inside | ----> | Some other text |
| | ----> | Inside |
|_____________________| ----> |____________________|
Fig 1.x Rectangle 1 to Rectangle 2
Используя некоторые другие методы, я обнаружил, что это фигура и ограничивающие ее координаты. Допустим, ограничивающими координатами являются [10, 30] и [100, 60], я хочу пометить все это как фигуру (как показано ниже)
_____________________________________________________________(100, 60)
| |
| _____________________ ____________________ |
| | Some text inside | ----> | Some other text | |
| | | ----> | Inside | |
| |_____________________| ----> |____________________| |
| |
| Fig 1.x Rectangle 1 to Rectangle 2 |
|_____________________________________________________________|
(10, 30)
Теперь я хочу отметить этот раздел как изображение. Я проверил библиотеки, такие как itextpdf или pdfbox. У них нет API для маркировки фигуры с помощью координат.
Другими словами, есть ли способы программно пометить элемент (группу изображений) как фигуру.