Как преобразовать модель spark mllib word2vec в текстовый формат перчатки?
Я использую Spark MLlib для обучения доменной модели word2vec, и мне нужно использовать ее в формате glove word2vec. Как я могу преобразовать его в текстовый формат перчатки?
1 ответ
Попробовав немного в SparkShell, я обнаружил, что код ниже работает для меня:
val vectors = model.getVectors
val writer = new BufferedWriter(new FileWriter(file))
vectors foreach ( entry => writer.write(entry._1 + " " + entry._2.mkString(" ") + "\n") )