Запрос на LSTM (Запрос на руководство)

Недавно я начал работать над проектом в университете. Основная задача проекта - применить Deep Learning для прогнозирования. У меня есть набор данных от компании, который в основном содержит различные параметры, которые могут повлиять на качество конечного продукта (например, температура, давление и т. Д.). Я должен применить LSTM к нему и прогнозировать на основе данных, если конечный продукт будет дефектным или нет. Я рассмотрел различные примеры LSTM, но в основном я вижу, как можно прогнозировать либо текущее значение на основе прошлых данных, либо будущие значения снова, используя прошлые данные, то есть прогнозируемые данные того же типа (либо на основе цены акций). на прошлых данных или температуры на основе прошлых температур и т. д.). Но для моего случая я должен использовать разные входные данные и просто предсказать, будет ли продукт неисправен или нет. Поскольку я новичок в этой области, я ценю любую помощь или предложения, которые вы можете мне дать.

1 ответ

Для любой проблемы, которую вы хотите решить с RNN, включая LSTM, хорошо определить архитектуру ввода-вывода. Это будет означать, что вам нужно ответить на два вопроса:

  1. Какова правильная архитектура? Посмотрите эту ссылку или похожие посты, если вы еще этого не сделали, чтобы познакомиться с различными архитектурами: многие к одному и многие ко многим примерам LSTM в Керасе

  2. Какую функцию активации вы должны использовать на выходном слое. Начните с ознакомления с различными функциями активации здесь: https://keras.io/activations/

Исходя из того, что вы объясняете, ваша проблема заключается в бинарной классификации данных временных рядов. Так что архитектура "многие к одному" и сигмоидная функция в качестве активации были бы хорошим началом.

Определив отношение ввода-вывода, вы можете улучшить свою сеть, добавив больше слоев, но сохранив общее отношение ввода-вывода.

Другие вопросы по тегам