Обработка текста из OCR

Всем привет и заранее спасибо за помощь. Я использую различные программы извлечения текста или распознавания текста для распознавания текста в документах. Предполагая, что у меня хорошее качество извлечения или распознавания, моя следующая задача - сопоставить фрагменты текста, например, такие идентификаторы, как имя человека или дата рождения. Например, допустим, я пытаюсь подобрать имя, такое как Джон Пол Джонс. Но, возможно, имя возвращается Джон Пол-Джонс, или Джон-Пол Джонс, или различные перестановки. Я предполагаю, что другие столкнулись с этой проблемой, и есть алгоритмы или лучшие методы, чтобы попытаться сопоставить. У меня есть таблица клиентов с именем и фамилией, которую я хотел бы попытаться сопоставить. Любое понимание будет оценено.

0 ответов

Другие вопросы по тегам