ConceptNet, связанный с тюнингом
Я использую ConceptNet http://conceptnet.io/ чтобы попытаться получить связанные ключевые слова, используя их конечные точки relatedto и edge / query. Данные потрясающие, однако я столкнулся с некоторым поведением, которое не могу понять.
Если вы запросите "relatedto" по ключевому слову "person" с лимитом 20 на основном сайте, вы получите:
http://conceptnet.io/c/en/person?rel=/r/RelatedTo&limit=20
Или этот список слов:
doll
character
statue
person
servant
body
farmer
child
man
baby
guard
name
doctor
captain
people
neighbour
boy
Довольно круто, верно? Это супер актуально и полезно.
С другой стороны, если вы запрашиваете API с тем же запросом, отформатированным для API:
http://api.conceptnet.io/related/c/en/person?filter=/c/en&limit=20
Сокращено для ясности (см. Ссылку выше для полного ответа):
{
"@id": "/c/en/person",
"related": [
{
"@id": "/c/en/person",
"weight": 1.0
},
{
"@id": "/c/en/sean_connery",
"weight": 0.963
},
{
"@id": "/c/en/steve_ballmer",
"weight": 0.962
},
{
"@id": "/c/en/norman_jewison",
"weight": 0.962
},
{
"@id": "/c/en/aretha_franklin",
"weight": 0.962
}
]
}
Да. Что там произошло? Это намного менее полезно. Мы получили только имена и не очень похожие термины.
Итак, мой вопрос: как мне получить подобный список?
Используют ли они какой-либо сложный анализ границ (используя стандартный, не связанный с запросом), чтобы получить связанные термины на веб-сайте?
ИЛИ ЖЕ
Я что-то упускаю из виду?
Любая помощь высоко ценится.
Спасибо
1 ответ
Для запроса существующих ребер с пометкой /r/RelatedTo
которые содержат узел /c/en/person
, вы должны запросить: http://api.conceptnet.io/query?node=/c/en/person&rel=/r/RelatedTo
Результаты этого запроса соответствуют веб-сайту.
/related
Конечная точка отличается и присутствует только в API. Он применяет некоторое машинное обучение для прогнозирования связанных узлов, независимо от того, присутствует ли ребро, соединяющее их, в ConceptNet. Это лучше для более конкретных понятий, чем "человек". Попробуйте "учитель", например: http://api.conceptnet.io/related/c/en/teacher?filter=/c/en&limit=20