SDK, похожие на Google Cloud Vision
Я делаю систему в C #, которая должна анализировать изображение клавиатуры, возвращая положение символов в нем.
Я пытался использовать IBM Watson, но он не возвращает позицию классификаций, после этого я пытался использовать Google Cloud Vision, потому что в демонстрационной версии сайта он возвращает позиции символов в формате JSON, однако у меня были проблемы с GOOGLE_APPLICATION_CREDENTIALS (посмотрите здесь)
Я хотел бы знать, есть ли какая-либо другая альтернатива, предпочтительно бесплатная или с большим количеством свободного доступа, для такого рода чтения изображения и возврата положения символов?
Мне не нужно OCR Я хочу вернуть положение символа на изображении
1 ответ
ocr.space предлагает хороший и бесплатный ocr api. Поскольку это "только" OCR API, его проще использовать, чем Google Cloud Vision.
возвращает позиции символов в формате JSON,
То же самое для этого API. Результаты содержат ограничивающие рамки каждого слова:
{
"ParsedResults" : [
{
"TextOverlay" : {
"Lines" : [
{
"Words": [
{
"WordText": "Word 1",
"Left": 106,
"Top": 91,
"Height": 9,
"Width": 11
},
{
"WordText": "Word 2",
"Left": 121,
"Top": 90,
"Height": 13,
"Width": 51
}