Результат обучения Spark word2vec сильно отличается от результата локальной реализации c.
Недавно я использую реализацию word2vec от spark mllib для обучения встраиванию слов. Я считаю, что эффективность сходства слов у искры плохая по сравнению с локальной реализацией c от Google. Я также пытаюсь использовать angel для обучения word2vec, и он тоже не работает. Я подозреваю, что это связано с некоторыми видами расхождений из-за распределенного обучения или с неправильной настройкой гиперпараметров. Кто-нибудь может дать совет?