Почему у word2vec есть "а", а не "а", "из" и т. д.
Так что речь идет о предварительно подготовленном 300d w2v в новостях Google.
Просто любопытно, почему "the" есть в списке словаря, а "a", "of", "and" и т. Д. Нет?
В оригинальной статье упоминается, что наиболее часто встречающиеся слова менее информативны в предсказании соседей, поэтому они исключены. Хотя по-прежнему "нет".