Как создать данные о нескольких кадрах для обучения и тестирования из общих пользовательских данных NER?
Я использую эту библиотеку для обучения модели NER с несколькими выстрелами.https://github.com/thunlp/Few-NERD
Как мы можем использовать сценарий для создания данных об эпизодах для обучения и тестирования из общих пользовательских данных NER.
Хотя у модуля есть код, но его немного сложно пройти, сделайте его утилитой для этого.
Было бы полезно иметь простую утилиту для 2 вещей:
- Генерируйте данные эпизода/теста из пользовательских данных в требуемом формате.
- Сценарий вывода
Мои данные в таком формате:
[
{'text':
'TN: ***************\nYour item was delivered at the front door or porch at 09:18\nam on Jan 15, 1991 in **********.\n
ABCD Tracking ADT® Available\nStatus\n✔ Delivered, Front Door \nJan 25, 1991 at 10:24 am\******************\nGet Updates',
'spans': [{'start': 17, 'end': 39, 'label': 'TN', 'ngram': '*******************'},
{'start': 142, 'end': 161, 'label': 'Carrier', 'ngram': 'ABCD Tracking ADT®'},
{'start': -1, 'end': 5, 'label': 'seller', 'ngram': 'nannan'},
{'start': -1, 'end': 5, 'label': 'cust', 'ngram': 'nannan'},
{'start': 210, 'end': 233, 'label': 'DOS', 'ngram': '09:18\nam on Jan 15, 1991'}
]}
]
Пожалуйста, дайте мне знать, написал ли кто-нибудь сценарий и код вывода для генерации данных эпизода-поезда/теста?