Почему у word2vec есть "а", а не "а", "из" и т. д.

Так что речь идет о предварительно подготовленном 300d w2v в новостях Google.

Просто любопытно, почему "the" есть в списке словаря, а "a", "of", "and" и т. Д. Нет?

В оригинальной статье упоминается, что наиболее часто встречающиеся слова менее информативны в предсказании соседей, поэтому они исключены. Хотя по-прежнему "нет".

0 ответов

Другие вопросы по тегам