Использование Label Studio для создания набора данных, такого как CORD v2.
Я использую Label Studio для создания набора данных для задачи OCR, позволяющей распознавать элементы в группе квитанций. Я пытаюсь использовать предварительно обученную модель в Hugging Face под названием Donut, которая была обучена с использованием набора данных CORD v2. Вот ссылка на документацию CORD. Я перепробовал множество шаблонов и использовал множество структур, чтобы пометить их так, как в CORD, но мне это не удалось. Есть ли кто-нибудь, кто может написать сценарий для маркировки моего набора данных и создания файла JSON, представленного в документации, или, по крайней мере, помочь мне найти хороший источник для этого. Спасибо
Я попробовал шаблон OCR в Label Studio, а также множество руководств на их веб-сайте и YouTube.