Как я могу протестировать Dialogflow на обнаружение намерений и извлечение сущностей?
У меня есть агент Dialogflow, который имеет намерения и типы сущностей, намерения, состоящие из обучающих фраз, отмеченных типами сущностей.
Я могу легко протестировать один запрос в консоли и получить диагностическую информацию о согласованном намерении и извлеченной сущности или сущностях.
У меня есть тестовый набор данных, содержащий более 600 запросов, аннотированных намерениями и сущностями в формате JSON. Я хотел бы протестировать агент Dialogflow с этим тестовым набором данных, а затем проанализировать результаты, правильно ли обнаружено намерение, какие объекты извлекаются и еще много чего. Вот фрагмент кода из тестового набора данных:
{
"text": "book a chinese restaurant",
"intent": "Reserve",
"entities": [
{
"entity": "Cuisine",
"startPos": 7,
"endPos": 13,
"children": []
}
]
}
Прежде чем я использовал функциональные возможности пакетного тестирования для Microsoft LUIS, я смог загрузить весь JSON-файл набора данных и даже позже увидеть результаты Precision / Recall / F-1 Score в консоли. Мне интересно, есть ли аналогичная функциональность для Dialogflow или какой-либо способ одновременного тестирования 600+ запросов.