Ограниченная машина Больцмана - реконструкция
Я прочитал несколько статей об ограниченных машинах Больцмана. Эти машины были проверены на их возможности восстановления. Я понимаю, как работает тренировка, но не то, как это делается. Кто-нибудь может дать мне несколько советов?
4 ответа
Ограниченные машины Больцмана - это генеративные модели, которые могут генерировать выборки для заданных скрытых единиц.
Для реконструкции, во-первых, входные данные ограничиваются видимыми единицами, а скрытые состояния вычисляются с использованием веса модели. На втором этапе видимые единицы вычисляются с использованием недавно вычисленных скрытых состояний. Видимые состояния, которые вы получаете на втором этапе, представляют собой реконструированный образец.
Сравнение входных данных и восстановленной выборки (поэлементное сравнение и т. Д.) Дает ошибку восстановления.
Выступление Джеффа Хинтона:
Я думаю, что вы имеете в виду RBM, используемый в контексте автоэнкодера для вызова входных данных, скорее как ассоциативная сеть памяти.
На этапе обучения входные единицы и выходные узлы (единицы) фиксируются на значениях, найденных в обучающем наборе, после чего повторная выборка Больцмана (например, с помощью комбинации Метрополиса Гастингса и Симулированного отжига) используется в сочетании с градиентным спуском для оптимизации взвешивает по всем соединениям между входными, скрытыми и выходными узлами. После обучения ограниченную сеть Больцмана можно использовать для 1) классификации / прогнозирования или 2) генерации памяти в режиме свободного хода.
В режиме классификации / прогнозирования некоторые или все входные блоки фиксируются, в то время как скрытые и выходные узлы отбираются с помощью выборки Больцмана. Статистические свойства (по существу, средства) выходных узлов являются предсказаниями или классификациями. Если RBM структурирован как однослойный автоэнкодер с входным слоем, который напоминает выходной слой, и разреженным или меньшим скрытым слоем, то ограниченное количество входов, приводящее к полному восстановлению обучающего ввода, составило бы "реконструкцию".
Наука Хинтона 2006 года обсуждает некоторые из этих идей:
http://www.cs.toronto.edu/~hinton/science.pdf
Эта статья представляет собой довольно специфическое применение RBM и нейронных сетей. В этой статье он использует RBM для предварительной подготовки глубокой (многоуровневой) нейронной сети.
В алгоритме Хинтона они используют RBM для предварительного обучения, так что начальные веса близки к хорошему решению, обеспечивающему сходимость градиентного спуска.
На следующем шаге исходная сеть (скажем, [1000 500 100 2]) раскрывается для создания сети с автоматическим кодированием ([1000 500 100 2 100 500 1000]). Части кодера ([1000 500 100 2]) и декодера ([2 100 500 1000]) первоначально используют одинаковые веса.
Последний этап - доводка. Он использует обратное распространение через весь автокодер ([1000 500 100 2 100 500 1000]) для точной настройки весов (путем минимизации ошибки, которая является разницей между входом и его восстановлением) для оптимальной реконструкции. Выход автокодера является реконструкцией входа.