Как получить только рукописный текст в результате API распознавания рукописного ввода Microsoft?

Question

Как получить только рукописный текст в результате API распознавания рукописного ввода Microsoft?

Я некоторое время использую Microsoft vision API для распознавания рукописного текста. Когда я попробовал тот же API несколько месяцев назад (скажем, около 7 месяцев), он дал результаты только для рукописного текста.

Например, если Имя напечатано на машине, а Арун написан от руки, в результатах будет только Арун.

Но теперь я получаю и Имя, и Аруна в результатах. Из-за этого я не могу уловить фактическое значение.

Я просмотрел их документацию по API и обнаружил, что у них есть параметр запроса handwritten=true и в V2 они имели mode=Handwritten/Printed, Но это только решит, должен ли он вызывать API рукописного ввода или OCR API.

Итак, могу ли я сказать API, что мне нужны результаты только из рукописного текста? Если нет, как можно классифицировать рукописный/машинный печатный текст, кроме решения для машинного обучения? Есть ли альтернативы для этого API, которые будут соответствовать моим требованиям?

1

azure azure-cognitive-services microsoft-cognitive handwriting-recognition icr

Источник

user8283737 28 авг '18 в 18:41

1 ответ

Другие вопросы по тегам azure azure-cognitive-services microsoft-cognitive handwriting-recognition icr

user10244722 29 авг '18 в 02:29 2018-08-29 02:29 · Answer 1 · 2018-08-29 02:29

Если нет, как можно классифицировать рукописный / машинный печатный текст, кроме решения для машинного обучения?

Нет, по крайней мере пока. Исходя из моих тестов, Google OCR API и Microsoft API могут обнаруживать рукописный текст, но в то же время обнаруживают напечатанный текст.

Таким образом, единственное решение сейчас было бы индивидуальным решением ML (я попробовал это, но потерпел неудачу..., потому что переход между рукописным текстом и печатным текстом бегло.).

Одним из простых способов решения этой проблемы является поиск цвета рукописного текста, если вы можете предположить, что он отличается от печатного текста.