Описание тега word2vec
Этот инструмент обеспечивает эффективную реализацию архитектур непрерывного набора слов и скип-грамм для вычисления векторных представлений слов. Эти представления могут впоследствии использоваться во многих приложениях обработки естественного языка и для дальнейших исследований.
Word2vec использует распределенные представления текста, чтобы зафиксировать сходство между концепциями. Например, он понимает, что Париж и Франция связаны так же, как Берлин и Германия (столица и страна), а не так, как Мадрид и Италия.
Это имеет очень широкий спектр потенциальных приложений: представление и извлечение знаний; машинный перевод; ответы на вопросы; разговорные системы; и много других.
Оригинальная статья Миколова и др. al. можно найти в arxiv.