Тессеракт (.NET) + PDF с возможностью поиска. Как подать заявку?

Мне нужно разработать систему, которая превращает изображение в PDF с возможностью поиска. Как работает школа? Мне нужно что-то с открытым исходным кодом. После долгих исследований я нашел tessnet2 (tesseract), и я могу удалить текст изображения в формате TIFF. Но как преобразовать эту информацию в PDF? Внимание: мне нужно сохранить структуру файла.

Мне нужно направление, чтобы продолжить мое исследование. Кто-нибудь, помогите мне, пожалуйста.

благодарю вас

1 ответ

Решение

Существует пара библиотек.NET hOCR-to-PDF, которые вы можете проверить на странице Tesseract 3rdParty.

Другие вопросы по тегам