GloVe - это алгоритм обучения без учителя для получения векторных представлений слов (вложения слов).
0 ответов

Использование GLOVEs pretrained glove.6B.50.txt в качестве основы для встраивания слов R

Я пытаюсь преобразовать текстовые данные в векторы с помощью GLOVE в r. Мой план состоял в том, чтобы усреднить векторы слов в предложении, но я не могу добраться до стадии векторизации слова. Я скачал файл glove.6b.50.txt и его родительский zip-фай…
17 ноя '18 в 05:18
0 ответов

Персонализированные или предварительно обученные векторы слов в Glove при наличии слов на нескольких языках?

Я пытаюсь кластеризовать короткие описания событий в одном предложении из базы данных длиной 3 млн. Строк. Каждая строка имеет около одного предложения. Одним из важных аспектов является то, что мои данные содержат слова из других языков, используем…
04 окт '18 в 09:34
0 ответов

UserWarning: интерактивный сеанс уже активен. Это может вызвать ошибки нехватки памяти в некоторых случаях

serWarning: интерактивный сеанс уже активен. Это может вызвать ошибки нехватки памяти в некоторых случаях. Вы должны явно позвонить InteractiveSession.close() освободить ресурсы, удерживаемые другим сеансом (ами). warnings.warn("Интерактивный сеанс …
31 дек '18 в 05:24
0 ответов

Помогает ли POS-тегирование встраиванию ELMo? Также выдается много ложных срабатываний в случае измерения сходства.

Я пытался найти сходство для двух предложений, и мне было интересно, учитывали ли вложения ELMo концепцию тегов POS при создании векторного вывода для предложения. Если нет, если я введу свое предложение с помощью тегов pos(скажем, с помощью SpaCy),…
03 янв '19 в 13:14
1 ответ

Можно ли заморозить только определенные веса вложения в слое в pytorch?

При использовании вложения GloVe в задачи NLP некоторые слова из набора данных могут отсутствовать в GloVe. Поэтому мы создаем случайные веса для этих неизвестных слов. Возможно ли заморозить гири, полученные из GloVe, и тренировать только новые инс…
28 фев '19 в 11:23
1 ответ

Бегущая перчатка на окнах

Можно ли установить перчатку на windows 10? С https://nlp.stanford.edu/projects/glove/: Скомпилируйте источник: cd GloVe-1.2 && make Но как я могу запустить "make" в Windows?
22 июл '18 в 08:50
1 ответ

Сходство двух слов в GloVe

Как найти сходство двух слов в Glove? У нас есть модель. сходство (word1, word2) в Word2vec.Есть ли аналогичный способ в GloVe. Как сохранить и загрузить обученную модель GloVe?
08 янв '19 в 20:27
1 ответ

Есть ли способ удалить слово из словаря KeyedVectors?

Мне нужно удалить недопустимое слово из словаря "gensim.models.keyedvectors.Word2VecKeyedVectors". Я пытался удалить его с помощью del model.vocab[word]если я распечатаю model.vocab слово исчезло, но когда я бегу model.most_similar используя другие …
14 фев '19 в 19:26
0 ответов

Сбой встраивания Tensorflow из-за неодинакового графа

Я создаю модель видео LSTM + с использованием поиска встраивания GloVe, но мне не удается, потому что мои значения заполнителей явно не в том же графике, что и матрица встраивания GloVe. Соответствующий код: class BaseModel(object): def __init__(sel…
28 фев '19 в 23:27
0 ответов

Ошибка сегментации (ядро сброшено) в Glove.c

Я пытаюсь обучить Перчатку https://github.com/stanfordnlp/GloVe/blob/master/src/glove.c на довольно большом наборе данных, новейшем вики-дампе (текстовый файл 22G). Общее количество слов, которые я тренирую, составляет 1,7 мил. Каждый файл (shuffle,…
11 июл '18 в 20:39
4 ответа

Ошибка при встраивании: не удалось преобразовать строку в число с плавающей точкой: 'ng'

Я работаю над предварительно обученными векторами слов, используя метод GloVe. Данные содержат векторы на данных Википедии. При встраивании данных я получаю сообщение об ошибке, которое не может преобразовать строку в число с плавающей точкой: 'ng' …
29 ноя '18 в 14:32
0 ответов

Как сформировать вложения предложений из вложения слов, используя перчатку на обученных тензорах данных?

Я работаю с набором данных, содержащим фрагменты информации о событиях. Мой фрейм данных выглядит примерно так: index| event_description ---------------------- 1 | concert with thousands of people 2 | people gathering 3 | there was an event in the c…
21 сен '18 в 20:28
0 ответов

Как конвертировать текстовый файл по word2vec, используя python

Я новичок в языке Python, обработке естественного языка, глубоком изучении, нейронных сетях. Я хочу выполнить программу, которая преобразует текстовый файл в вектор, используя word2vec в Python. Кто-то, пожалуйста, помогите мне import math import nl…
0 ответов

Перчатка Pytorch ускоряется

Я пытаюсь реализовать алгоритм GloVe в pytorch, Это первый раз, когда я использую pytorch и я думаю, что моя реализация может быть не очень эффективной. Помимо очевидного (векторизация for loop то есть запускать каждую партию) Есть ли что-нибудь, чт…
24 окт '17 в 09:16
2 ответа

Эффективное преобразование токенов в векторы слов с помощью TensorFlow Transform

Я хотел бы использовать TensorFlow Transform для преобразования токенов в векторы слов на этапе обучения, проверки и вывода. Я последовал за этим постом Stackru и осуществил первоначальное преобразование из токенов в векторы. Преобразование работает…
0 ответов

Вложения GloVe - неизвестный / вне словарный токен

Я хотел бы знать, существует ли общий (по умолчанию) вне словарный (OOV) токен для встраивания GloVe. В частности, для предварительно обученных из Стэнфорда: https://nlp.stanford.edu/projects/glove/ Я нашел это на SO: Что такое "unk" в glove.6B.50d.…
1 ответ

Как преобразовать модель spark mllib word2vec в текстовый формат перчатки?

Я использую Spark MLlib для обучения доменной модели word2vec, и мне нужно использовать ее в формате glove word2vec. Как я могу преобразовать его в текстовый формат перчатки?
1 ответ

Как рассчитать сходство для предварительно обученных вложений слов

Я хочу узнать наиболее похожие слова к другому из предварительно обученных векторов вложения в R. Например, слова, похожие на "пиво". Для этого я скачал предварительно встроенные векторы встраивания на http://nlp.stanford.edu/data/glove.twitter.27B.…
28 окт '18 в 20:36
0 ответов

Как получить матрицу совместного вхождения в python, необходимую для модуля GloVe

Чтобы использовать этот модуль GloVe, мне нужна точно определенная форма матрицы сопутствующих явлений. На данный момент у меня есть это: def wwcoomtrx(inlist): logging.info('libmatrix.py > wwcoomtrx') vocabulary = {} # map terms to column indice…
03 фев '19 в 19:54
1 ответ

Улучшение базовой, существующей модели GloVe

Я использую GloVe как часть моего исследования. Я скачал модели отсюда. Я использовал GloVe для классификации предложений. Предложения, которые я классифицирую, относятся к определенной области, скажем, к какой-то теме STEM. Однако, поскольку сущест…
25 апр '17 в 18:15