Описание тега lstm-stateful

Тег относится к ячейкам долговременной краткосрочной памяти с сохранением состояния (LSTM) в нейронной сети (то есть ячейкам, которые запоминают свое состояние для следующего пакета обучения)
0 ответов

Предсказать произвольное количество временных шагов с помощью модели LSTM

Я слежу за серией уроков по прогнозированию временных рядов с использованием моделей LSTM Джейсона Браунли ( https://machinelearningmastery.com/how-to-develop-lstm-models-for-multi-step-time-series-forecasting-of-household-power-consumption/). Мои н…
27 май '19 в 15:04
0 ответов

Как переписать Keras Stateful LSTM в чистый Tensorflow?

Кто-нибудь может поделиться идеей / блогом / фрагментом кода о том, как преобразовать Keras Stateful LSTM в чистую модель Tensorflow? А затем обучить его на партии.. Tensorflow не поддерживает Keras Stateful LSTM на TPU. Их разработчики отказались э…
26 май '19 в 17:52
1 ответ

Почему моя точность всегда 0,2 в этом простом коде

Я новичок в этой области и пытаюсь повторно запустить пример кода LSTM, скопированного из Интернета. Точность модели LSTM всегда равна 0,2, но прогнозируемый результат абсолютно верен, что означает, что точность должна быть 1. Может кто-нибудь сказа…
0 ответов

Две структуры не имеют одинаковую вложенную структуру при добавлении return_state=True поверх LSTM

Я не знаю, является ли это ошибкой или ошибкой. Я также сообщил об этой проблеме здесь. То, что я пытаюсь сделать, - это то, что я хочу сделать свой собственный LSTM готовым к использованию. Так что этот код работает нормально without добавление ret…
08 июн '19 в 20:05
0 ответов

Сомнения в "обратном распространении LSTM" и его экспоненциально долгом обучении

Вот реализация обратного распространения LSTM с нуля, я не уверен с dfhs (производной от состояния hs), я делаю это правильно? Пожалуйста, исправьте меня, где я ошибаюсь в своем коде, который я пробовал так много раз, но предсказание LSTM ужасно, не…
18 июл '19 в 14:07
0 ответов

Модельное предложение для обнаружения вредоносного ПО на основе нескольких последовательностей вызовов API

Я пытаюсь построить модель RNN (LSTM) для классификации бинарных файлов как доброкачественных / вредоносных программ. Структура данных, которую я сейчас представляю, выглядит следующим образом { "binary1": { "label": 1, "sequences": [ ["api1","api2"…
0 ответов

Как исправить "Невозможно обновить переменную с shape [], используя Tensor with shape [1000], формы должны быть одинаковыми". ошибка в сети keras LSTM?

Я пытаюсь создать сеть LSTM с отслеживанием состояния. Я собираюсь использовать алгоритмический поиск гиперпараметров, но до этого он должен работать с параметрами по умолчанию, однако это не так. Я продолжаю получать "tenorsflow.python.framework.er…
04 авг '19 в 17:14
0 ответов

Керас: Как извлечь скрытые состояния и / или состояния ячеек из нескольких уровней LSTM?

Нужна помощь для захвата скрытых состояний и / или состояний ячеек для следующей модели LSTM для каждого слоя Выдержки из кода Python, которые я мог бы соединить вместе: model = Sequential() model.add(LSTM(units=50, return_sequences=True, return_sta…
05 авг '19 в 16:45
1 ответ

Предоставление входных данных для ячейки LSTM в API Keras

Я читаю о LSTM в глубоком изучении. От профессора Эндрю Нг курса LSTM три входа для каждой ячейки LSTM. Входными данными являются состояние ячейки из предыдущей ячейки, т. Е. Верхний индекс "c" (t-1) и выходной сигнал суперскрипта "a" ячейки LSTM (t…
15 июл '19 в 12:57
2 ответа

Keras: разделить весовые коэффициенты между примерами обучения (не между слоями)

Проблема в следующем. У меня есть категорическое задание на прогноз словарного запаса размером 25К. На одном из них (входной словарь 10K, выходной дим, т.е. вложение 50) я хочу ввести обучаемую матрицу весов для умножения матриц между входным вложен…
26 июн '19 в 00:45
0 ответов

Основной прогноз временных рядов с помощью lstm

У меня есть последовательность, и я хотел бы сделать простейший LSTM, чтобы предсказать остальную часть последовательности. Это означает, что я хочу начать с использования только предыдущего шага, чтобы предсказать следующий, а затем добавить больше…
21 авг '19 в 15:56
0 ответов

Обнаружение аномалий временных рядов LSTM

Я пытаюсь найти аномалию во временных рядах с помощью LSTM. И мне все еще интересно, какой должна быть правильная архитектура, временные шаги, размер пакета, скользящие или нескользящие окна для нахождения аномалии, основанной на поведении временных…
28 июн '19 в 09:48
2 ответа

Pytorch LSTM против LSTMCell

В чем разница между LSTM и LSTMCell в Pytorch (в настоящее время версия 1.1)? Кажется, что LSTMCell - это особый случай LSTM (то есть только с одним слоем, однонаправленный, без выпадения). Тогда какова цель наличия обеих реализаций? Если я что-то н…
0 ответов

Есть ли способ в Keras не иметь размер y, равный размеру пакета X для LSTM с отслеживанием состояния?

Я пытаюсь обновить вес только в конце партии, и я знаю, что это поведение по умолчанию, но я не понимаю, почему вам нужно, чтобы ваши X и Y были одинакового размера? Если у меня есть X.shape(12,32,64), в котором я использую размер пакета 12, то поче…
21 апр '20 в 10:27
0 ответов

Классификация видео с использованием LSTM с отслеживанием состояния, точность проверки не улучшается

Я пытаюсь разделить видео на 3 разных класса. Каждое видео имеет разную длину кадра. Данные обучения имеют форму (104, Нет, 528), где: 104 = Количество видео Нет = количество кадров для каждого видео, которые отличаются 528 = Количество функций для …
1 ответ

Как реализовать мультисостояние LSTM RNN в keras

У меня 1000 отдельных пользователей, и набор данных состоит из действий этих пользователей за последний год. Всего записей более 300К. Входы для LSTM RNN имеют векторы признаков, соответствующие этим пользователям. Пользователь также включен, потому…
19 сен '19 в 16:28
2 ответа

Плотный ожидает 2d, но получил 3d в LSTM

В моей модели Xtrain shape : (62, 30, 100) Ytrain shape : (62, 1, 100) Xtest shape : (16, 30, 100) Ytest shape : (16, 1, 100) Когда я строю свою модель, model = Sequential() model.add(LSTM(units=100, return_sequences= True, input_shape=(x_train.shap…
1 ответ

Обучение LSTM с отслеживанием состояния "многие ко многим" с финальным плотным слоем и без него

Я пытаюсь обучить повторяющуюся модель в Keras, содержащую LSTM, для целей регрессии. Я хотел бы использовать модель в Интернете, и, насколько я понял, мне нужно обучить LSTM с отслеживанием состояния. Поскольку модель должна выводить последовательн…
25 сен '19 в 19:53
0 ответов

Недоумение для (не имеющего состояния) трансформатора - почему все еще справедливо сравнивать с RNN?

Мне ясно, как вычислить недоумение для RNN, поскольку RNN являются моделью с отслеживанием состояния. В общем, учитывая очень длинный документ, я считаю, что нам нужно: 1. разбить документ на последовательность фрагментов и вычислить потерю кросс-эн…
1 ответ

TF 2.0 последовательная CNN в LSTM для регрессии ошибки "Отрицательный размер"

Я пытаюсь построить модель, которая прогнозирует цену определенного товара на основе текущих рыночных условий, мои данные имеют форму, аналогичную num_samples = 100 sample_dimension = 10 XXX = np.random.random((num_samples,sample_dimension)).reshape…