SDK, похожие на Google Cloud Vision

Я делаю систему в C #, которая должна анализировать изображение клавиатуры, возвращая положение символов в нем.

Я пытался использовать IBM Watson, но он не возвращает позицию классификаций, после этого я пытался использовать Google Cloud Vision, потому что в демонстрационной версии сайта он возвращает позиции символов в формате JSON, однако у меня были проблемы с GOOGLE_APPLICATION_CREDENTIALS (посмотрите здесь)

Я хотел бы знать, есть ли какая-либо другая альтернатива, предпочтительно бесплатная или с большим количеством свободного доступа, для такого рода чтения изображения и возврата положения символов?

Мне не нужно OCR Я хочу вернуть положение символа на изображении

1 ответ

Решение

ocr.space предлагает хороший и бесплатный ocr api. Поскольку это "только" OCR API, его проще использовать, чем Google Cloud Vision.

C# OCR пример проекта

возвращает позиции символов в формате JSON,

То же самое для этого API. Результаты содержат ограничивающие рамки каждого слова:

{
        "ParsedResults" : [
            {
                "TextOverlay" : {
                    "Lines" : [
                        {
                            "Words": [
                                {
                                "WordText": "Word 1",
                                "Left": 106,
                                "Top": 91,
                                "Height": 9,
                                "Width": 11
                                },
                                {
                                "WordText": "Word 2",
                                "Left": 121,
                                "Top": 90,
                                "Height": 13,
                                "Width": 51
                                }
Другие вопросы по тегам