Python: что такое метод gdata для загрузки изображения с включенным OCR?

Как показано в этом коде PHP, ( http://code.google.com/p/gdata-samples/source/browse/trunk/doclist/OCRDemo/ocr.php?r=194)

где изображение может быть загружено в документы Google, которые автоматически преобразуются в текст. Мне интересно, как это сделать в Python. есть метод "загрузки", но я просто озадачен, как включить функцию OCR.

1 ответ

Решение

При условии, что вы начали здесь: http://code.google.com/apis/documents/docs/3.0/developers_guide_python.html

у вас есть аутентифицированный client объект уже создан.

f = open('/path/to/your/test.pdf')
ms = gdata.data.MediaSource(file_handle=f, content_type='application/pdf', content_length=os.path.getsize(f.name))
folder = "https://docs.google.com/feeds/default/private/full" # folder in google docs.
entry = client.Upload(ms, f.name, folder_or_uri= folder + '?ocr=true') # ?ocr=true is the kicker

указание папки_или_ури с трейлингом ?ocr=true param - это то, что вызывает преобразование.

после создания вы можете экспортировать его как текстовый документ.

Другие вопросы по тегам