IBM Watson- Извлечение ключевых слов и концепций

Я пытаюсь найти правильный метод для извлечения ключевых слов и концепций из большого пакета документов по отдельности. На DW было рекомендовано использовать IBM Watson- Knowledge Studio. Знание Studio связано с Discovery, я не могу найти в Справочнике по API Discovery, как вытащить ключевые слова и концепции по отдельности. Я легко могу посмотреть на концепции на макроуровне, но мне нужны ключевые слова и концепции для каждого файла в отдельности. Все мои файлы были загружены в Студию Знаний. Кроме того, я также загрузил все в Discovery. Мне не удалось извлечь информацию для отдельного файла. Справочное руководство по API не охватывает извлечение информации вплоть до отдельного уровня для файла, который был загружен. На прошлой неделе я подал заявку в службу поддержки, и ответом было опубликовать вопрос в Stackru для дополнительной поддержки. Каков правильный метод поиска ключевых слов и понятий для каждого файла в отдельности в большом количестве файлов? Дискавери или НЛУ?

Любое руководство с благодарностью.

1 ответ

Решение

Я думаю, что вы должны попробовать услугу понимания естественного языка. Вот демонстрационная версия, которая позволит вам анализировать текст и извлекать понятия и ключевые слова https://natural-language-understanding-demo.mybluemix.net/.

Я бы порекомендовал вам сначала прочитать документацию, а затем взглянуть на API Reference, где вы найдете, как вызвать метод для извлечения ключевых слов и понятий, основанных на разных языках.

Что вам нужно сделать, так это просмотреть свои файлы, прочитать содержимое и затем отправить его в NLU.

Вот пример того, как анализировать текст для извлечения понятий и ключевых слов в Node.js:

const NaturalLanguageUnderstandingV1 = require('watson-developer-cloud/natural-language-understanding/v1.js');
const service = new NaturalLanguageUnderstandingV1({
  'username': '{username}',
  'password': '{password}',
  'version_date': '2017-02-27'
});

const parameters = {
  text: 'IBM is an American multinational technology company headquartered in Armonk, New York, United States, with operations in over 170 countries.',
  features: {
    keywords: {
      emotion: true,
      sentiment: true,
      limit: 2
    },
    concepts: {
      limit: 3
    }
  }
}

service.analyze(parameters, (err, response) => {
  if (err)
    console.log('error:', err);
  else
    console.log(JSON.stringify(response, null, 2));
});
Другие вопросы по тегам