PDF манипулирование - пометка изображения или фигуры

У меня есть исходный pdf(untagged.pdf), из которого я буду создавать теговую версию (tagged.pdf)

У меня есть информация обо всех тегах HTML всего содержимого исходного PDF.

Теперь у меня есть рисунок на странице 3. Когда я анализирую программно, это не будет обнаружено как изображение, но это прямоугольник с некоторым текстом и другим прямоугольником, как показано ниже.

    _____________________         ____________________
   |    Some text inside | ----> |   Some other text  |
   |                     | ----> |            Inside  |
   |_____________________| ----> |____________________|

             Fig 1.x Rectangle 1 to Rectangle 2

Используя некоторые другие методы, я обнаружил, что это фигура и ограничивающие ее координаты. Допустим, ограничивающими координатами являются [10, 30] и [100, 60], я хочу пометить все это как фигуру (как показано ниже)

   _____________________________________________________________(100, 60)
  |                                                             |
  |      _____________________         ____________________     |
  |     |    Some text inside | ----> |   Some other text  |    |
  |     |                     | ----> |            Inside  |    |
  |     |_____________________| ----> |____________________|    |
  |                                                             |
  |           Fig 1.x Rectangle 1 to Rectangle 2                |
  |_____________________________________________________________|
  (10, 30)

Теперь я хочу отметить этот раздел как изображение. Я проверил библиотеки, такие как itextpdf или pdfbox. У них нет API для маркировки фигуры с помощью координат.

Другими словами, есть ли способы программно пометить элемент (группу изображений) как фигуру.

0 ответов

Другие вопросы по тегам