Описание тега glove
GloVe - это алгоритм обучения без учителя для получения векторных представлений слов (вложения слов).
0
ответов
Использование GLOVEs pretrained glove.6B.50.txt в качестве основы для встраивания слов R
Я пытаюсь преобразовать текстовые данные в векторы с помощью GLOVE в r. Мой план состоял в том, чтобы усреднить векторы слов в предложении, но я не могу добраться до стадии векторизации слова. Я скачал файл glove.6b.50.txt и его родительский zip-фай…
17 ноя '18 в 05:18
0
ответов
Персонализированные или предварительно обученные векторы слов в Glove при наличии слов на нескольких языках?
Я пытаюсь кластеризовать короткие описания событий в одном предложении из базы данных длиной 3 млн. Строк. Каждая строка имеет около одного предложения. Одним из важных аспектов является то, что мои данные содержат слова из других языков, используем…
04 окт '18 в 09:34
0
ответов
UserWarning: интерактивный сеанс уже активен. Это может вызвать ошибки нехватки памяти в некоторых случаях
serWarning: интерактивный сеанс уже активен. Это может вызвать ошибки нехватки памяти в некоторых случаях. Вы должны явно позвонить InteractiveSession.close() освободить ресурсы, удерживаемые другим сеансом (ами). warnings.warn("Интерактивный сеанс …
31 дек '18 в 05:24
0
ответов
Помогает ли POS-тегирование встраиванию ELMo? Также выдается много ложных срабатываний в случае измерения сходства.
Я пытался найти сходство для двух предложений, и мне было интересно, учитывали ли вложения ELMo концепцию тегов POS при создании векторного вывода для предложения. Если нет, если я введу свое предложение с помощью тегов pos(скажем, с помощью SpaCy),…
03 янв '19 в 13:14
1
ответ
Можно ли заморозить только определенные веса вложения в слое в pytorch?
При использовании вложения GloVe в задачи NLP некоторые слова из набора данных могут отсутствовать в GloVe. Поэтому мы создаем случайные веса для этих неизвестных слов. Возможно ли заморозить гири, полученные из GloVe, и тренировать только новые инс…
28 фев '19 в 11:23
1
ответ
Бегущая перчатка на окнах
Можно ли установить перчатку на windows 10? С https://nlp.stanford.edu/projects/glove/: Скомпилируйте источник: cd GloVe-1.2 && make Но как я могу запустить "make" в Windows?
22 июл '18 в 08:50
1
ответ
Сходство двух слов в GloVe
Как найти сходство двух слов в Glove? У нас есть модель. сходство (word1, word2) в Word2vec.Есть ли аналогичный способ в GloVe. Как сохранить и загрузить обученную модель GloVe?
08 янв '19 в 20:27
1
ответ
Есть ли способ удалить слово из словаря KeyedVectors?
Мне нужно удалить недопустимое слово из словаря "gensim.models.keyedvectors.Word2VecKeyedVectors". Я пытался удалить его с помощью del model.vocab[word]если я распечатаю model.vocab слово исчезло, но когда я бегу model.most_similar используя другие …
14 фев '19 в 19:26
0
ответов
Сбой встраивания Tensorflow из-за неодинакового графа
Я создаю модель видео LSTM + с использованием поиска встраивания GloVe, но мне не удается, потому что мои значения заполнителей явно не в том же графике, что и матрица встраивания GloVe. Соответствующий код: class BaseModel(object): def __init__(sel…
28 фев '19 в 23:27
0
ответов
Ошибка сегментации (ядро сброшено) в Glove.c
Я пытаюсь обучить Перчатку https://github.com/stanfordnlp/GloVe/blob/master/src/glove.c на довольно большом наборе данных, новейшем вики-дампе (текстовый файл 22G). Общее количество слов, которые я тренирую, составляет 1,7 мил. Каждый файл (shuffle,…
11 июл '18 в 20:39
4
ответа
Ошибка при встраивании: не удалось преобразовать строку в число с плавающей точкой: 'ng'
Я работаю над предварительно обученными векторами слов, используя метод GloVe. Данные содержат векторы на данных Википедии. При встраивании данных я получаю сообщение об ошибке, которое не может преобразовать строку в число с плавающей точкой: 'ng' …
29 ноя '18 в 14:32
0
ответов
Как сформировать вложения предложений из вложения слов, используя перчатку на обученных тензорах данных?
Я работаю с набором данных, содержащим фрагменты информации о событиях. Мой фрейм данных выглядит примерно так: index| event_description ---------------------- 1 | concert with thousands of people 2 | people gathering 3 | there was an event in the c…
21 сен '18 в 20:28
0
ответов
Как конвертировать текстовый файл по word2vec, используя python
Я новичок в языке Python, обработке естественного языка, глубоком изучении, нейронных сетях. Я хочу выполнить программу, которая преобразует текстовый файл в вектор, используя word2vec в Python. Кто-то, пожалуйста, помогите мне import math import nl…
22 сен '18 в 07:04
0
ответов
Перчатка Pytorch ускоряется
Я пытаюсь реализовать алгоритм GloVe в pytorch, Это первый раз, когда я использую pytorch и я думаю, что моя реализация может быть не очень эффективной. Помимо очевидного (векторизация for loop то есть запускать каждую партию) Есть ли что-нибудь, чт…
24 окт '17 в 09:16
2
ответа
Эффективное преобразование токенов в векторы слов с помощью TensorFlow Transform
Я хотел бы использовать TensorFlow Transform для преобразования токенов в векторы слов на этапе обучения, проверки и вывода. Я последовал за этим постом Stackru и осуществил первоначальное преобразование из токенов в векторы. Преобразование работает…
31 июл '18 в 05:40
0
ответов
Вложения GloVe - неизвестный / вне словарный токен
Я хотел бы знать, существует ли общий (по умолчанию) вне словарный (OOV) токен для встраивания GloVe. В частности, для предварительно обученных из Стэнфорда: https://nlp.stanford.edu/projects/glove/ Я нашел это на SO: Что такое "unk" в glove.6B.50d.…
14 ноя '18 в 18:26
1
ответ
Как преобразовать модель spark mllib word2vec в текстовый формат перчатки?
Я использую Spark MLlib для обучения доменной модели word2vec, и мне нужно использовать ее в формате glove word2vec. Как я могу преобразовать его в текстовый формат перчатки?
21 дек '18 в 23:36
1
ответ
Как рассчитать сходство для предварительно обученных вложений слов
Я хочу узнать наиболее похожие слова к другому из предварительно обученных векторов вложения в R. Например, слова, похожие на "пиво". Для этого я скачал предварительно встроенные векторы встраивания на http://nlp.stanford.edu/data/glove.twitter.27B.…
28 окт '18 в 20:36
0
ответов
Как получить матрицу совместного вхождения в python, необходимую для модуля GloVe
Чтобы использовать этот модуль GloVe, мне нужна точно определенная форма матрицы сопутствующих явлений. На данный момент у меня есть это: def wwcoomtrx(inlist): logging.info('libmatrix.py > wwcoomtrx') vocabulary = {} # map terms to column indice…
03 фев '19 в 19:54
1
ответ
Улучшение базовой, существующей модели GloVe
Я использую GloVe как часть моего исследования. Я скачал модели отсюда. Я использовал GloVe для классификации предложений. Предложения, которые я классифицирую, относятся к определенной области, скажем, к какой-то теме STEM. Однако, поскольку сущест…
25 апр '17 в 18:15