Как создать данные о нескольких кадрах для обучения и тестирования из общих пользовательских данных NER?

Я использую эту библиотеку для обучения модели NER с несколькими выстрелами.https://github.com/thunlp/Few-NERD

Как мы можем использовать сценарий для создания данных об эпизодах для обучения и тестирования из общих пользовательских данных NER.

Хотя у модуля есть код, но его немного сложно пройти, сделайте его утилитой для этого.

Было бы полезно иметь простую утилиту для 2 вещей:

  1. Генерируйте данные эпизода/теста из пользовательских данных в требуемом формате.
  2. Сценарий вывода

Мои данные в таком формате:

      
[
{'text': 
'TN: ***************\nYour item was delivered at the front door or porch at 09:18\nam on Jan 15, 1991 in **********.\n
ABCD Tracking ADT® Available\nStatus\n✔ Delivered, Front Door \nJan 25, 1991 at 10:24 am\******************\nGet Updates', 

'spans': [{'start': 17, 'end': 39, 'label': 'TN', 'ngram': '*******************'}, 
        {'start': 142, 'end': 161, 'label': 'Carrier', 'ngram': 'ABCD Tracking ADT®'}, 
        {'start': -1, 'end': 5, 'label': 'seller', 'ngram': 'nannan'}, 
        {'start': -1, 'end': 5, 'label': 'cust', 'ngram': 'nannan'}, 
        {'start': 210, 'end': 233, 'label': 'DOS', 'ngram': '09:18\nam on Jan 15, 1991'}
        ]}
]

Пожалуйста, дайте мне знать, написал ли кто-нибудь сценарий и код вывода для генерации данных эпизода-поезда/теста?

0 ответов

Другие вопросы по тегам