OCR для Деванагари (хинди / маратхи / санскрит)

Кто-нибудь имеет представление о недавней работе по оптическому распознаванию символов для индийских сценариев с использованием современных методов машинного обучения? Я знаю о некоторых исследованиях, проводимых в ISI, Calcutta, но, насколько мне известно, за последние 3-4 года ничего нового не появилось, а OCR для Деванагари, к сожалению, не хватает!

2 ответа

Решение

Это, конечно, слишком старый, чтобы быть полезным, но это круто: видео Инголов, говорящих на санскрите и OCR. ( Даниэль Х.Х. Ингаллс-старший, профессор и переводчик санскрита, а также его сын Дэн Ингаллс, ученый-компьютерщик, работающий с Smalltalk и т. Д.) Первая половина - Ингаллс-старший, описывающий проект автоматического анализа текста, а вторая - Ингаллс-младший. описывая, как он реализовал OCR для санскрита с нуля.

К вашему сведению: в 2003 году в New York Times была статья, в которой упоминается инструмент под названием ILT.

Другие вопросы по тегам