Тессеракт (.NET) + PDF с возможностью поиска. Как подать заявку?
Мне нужно разработать систему, которая превращает изображение в PDF с возможностью поиска. Как работает школа? Мне нужно что-то с открытым исходным кодом. После долгих исследований я нашел tessnet2 (tesseract), и я могу удалить текст изображения в формате TIFF. Но как преобразовать эту информацию в PDF? Внимание: мне нужно сохранить структуру файла.
Мне нужно направление, чтобы продолжить мое исследование. Кто-нибудь, помогите мне, пожалуйста.
благодарю вас
1 ответ
Решение
Существует пара библиотек.NET hOCR-to-PDF, которые вы можете проверить на странице Tesseract 3rdParty.