Как получить только рукописный текст в результате API распознавания рукописного ввода Microsoft?

Я некоторое время использую Microsoft vision API для распознавания рукописного текста. Когда я попробовал тот же API несколько месяцев назад (скажем, около 7 месяцев), он дал результаты только для рукописного текста.

Например, если Имя напечатано на машине, а Арун написан от руки, в результатах будет только Арун.

Но теперь я получаю и Имя, и Аруна в результатах. Из-за этого я не могу уловить фактическое значение.

Я просмотрел их документацию по API и обнаружил, что у них есть параметр запроса handwritten=true и в V2 они имели mode=Handwritten/Printed, Но это только решит, должен ли он вызывать API рукописного ввода или OCR API.

Итак, могу ли я сказать API, что мне нужны результаты только из рукописного текста? Если нет, как можно классифицировать рукописный/машинный печатный текст, кроме решения для машинного обучения? Есть ли альтернативы для этого API, которые будут соответствовать моим требованиям?

1 ответ

Если нет, как можно классифицировать рукописный / машинный печатный текст, кроме решения для машинного обучения?

Нет, по крайней мере пока. Исходя из моих тестов, Google OCR API и Microsoft API могут обнаруживать рукописный текст, но в то же время обнаруживают напечатанный текст.

Таким образом, единственное решение сейчас было бы индивидуальным решением ML (я попробовал это, но потерпел неудачу..., потому что переход между рукописным текстом и печатным текстом бегло.).

Одним из простых способов решения этой проблемы является поиск цвета рукописного текста, если вы можете предположить, что он отличается от печатного текста.

Другие вопросы по тегам