Описание тега word2vec

Этот инструмент обеспечивает эффективную реализацию архитектур непрерывного набора слов и скип-грамм для вычисления векторных представлений слов. Эти представления могут впоследствии использоваться во многих приложениях обработки естественного языка и для дальнейших исследований.

Word2vec использует распределенные представления текста, чтобы зафиксировать сходство между концепциями. Например, он понимает, что Париж и Франция связаны так же, как Берлин и Германия (столица и страна), а не так, как Мадрид и Италия.

Это имеет очень широкий спектр потенциальных приложений: представление и извлечение знаний; машинный перевод; ответы на вопросы; разговорные системы; и много других.

Оригинальная статья Миколова и др. al. можно найти в arxiv.