Описание тега meta-learning

1 ответ

Когда следует вызывать .eval () и .train () при выполнении MAML с более высокой библиотекой PyTorch?

Я просматривал пример omniglot maml и увидел, что у них net.train()в верхней части их тестового кода . Это похоже на ошибку, поскольку это означает, что статистика каждой задачи при мета-тестировании является общей: def test(db, net, device, epoch, …
0 ответов

Как использовать среднее и стандартное значение из обучения в Batch Norm?

Я хотел использовать средства, stds из обучения, а не пакетную статистику, поскольку кажется, что если я использую пакетную статистику, моя модель расходится (как здесь показаноКогда следует вызывать .eval() и .train () при выполнении MAML с более в…
0 ответов

Не удалось вычислить градиент в PyTorch

Я читал этот исследовательский документ — https://arxiv.org/abs/1908.00413 и пытался реализовать код из GitHub — https://github.com/hoyeoplee/MeLU, однако столкнулся с ошибкой времени выполнения. при обучении модели. Может ли кто-нибудь предложить в…
0 ответов

Будет ли создание «данных» градиента путем их отсоединения реализовать MAML первого порядка с использованием более высокой библиотеки PyTorch?

Я использовал более высокую библиотеку pytorch для MAML и хотел запустить MAML первого порядка. Я до сих пор не понимал, что track_higher_grads(вероятно, моя ошибка, потому что в прошлом я находил документы запутанными, например, см. Что означает до…
0 ответов

Несколько tf.GradientTape на одном уровне дают градиент NaN

Я выполняю этапы обучения метаобучению, в то время как мне нужно выполнить два отдельных градиентных спуска, используя tf.GradientTapeдля support_set и query_set на одном уровне. но оказывается, что градиент, вычисленный для цикла набора запросов, д…
29 ноя '21 в 13:18
0 ответов

Почему PyTorch не может найти все параметры для градиентного спуска с помощью MAML и библиотеки Learn2learn? (все параметры должны быть обновлены)

Я использовал структуру Learn2learn для метаобучения и получил эту ошибку: Traceback (most recent call last): File "/home/miranda9/miniconda3/envs/meta_learning_a100/lib/python3.9/site-packages/learn2learn/algorithms/maml.py", line 159, in adapt gra…
1 ответ

Метаобучение для поиска оптимальной модели из предварительно обученных моделей в Tensorflow

У меня много предварительно обученных моделей с разным количеством слоев (Модели не являются последовательными). Данные обучения имели форму (1, 1, 103) для этих моделей, а выходные данные представляли собой метку класса от 0 до 9. Я загрузил эти со…
0 ответов

вещи, связанные с метаобучением, работают только в pytorch? мы не можем использовать библиотеки tensorflow

вещи, связанные с метаобучением, работают только в pytorch? мы не можем использовать библиотеки tensorflow
1 ответ

Почему RandomCrop с размером 84 и отступом 8 возвращает размер изображения 84, а не 100 в pytorch?

Я использовал набор данных mini-imagenet и заметил эту строку кода: elif data_augmentation == 'lee2019: normalize = Normalize( mean=[120.39586422 / 255.0, 115.59361427 / 255.0, 104.54012653 / 255.0], std=[70.68188272 / 255.0, 68.27635443 / 255.0, 72…
0 ответов

PyTorch: неявные градиенты возвращают (нет) метаградиент

Я пытаюсь реализовать алгоритм неявных градиентов [1, 2, 3] для оптимизации некоторых метапараметров (в моем случае параметров функции потерь). Однако создаваемые (мета-)градиенты всегда равны None. Могу ли я получить некоторую помощь в определении …
23 мар '22 в 03:43
1 ответ

Как разделить классы в классификации нескольких выстрелов с помощью CIFAR-10?

Я хочу обучить модель, которая выполняет классификацию изображений с несколькими снимками с использованием CIFAR-10. Поэтому мне приходится тренировать модель с небольшим количеством классов, а остальные классы использовать для тестирования. Мне инт…
0 ответов

ValueError: График отключен: невозможно получить значение для тензора KerasTensor(type_spec=TensorSpec(shape=(None, None, None, 3)

Я работаю над подходом MetaLearning к решению проблемы сегментации изображения. Я обучил 7 разных моделей на разных классах, связанных с набором данных о глазах, предоставленным Oculus SBVPI (радужная оболочка, зрачок, склера, кантус, периокуляр, со…
0 ответов

Будет ли pytorch корректировать порядок кода в соответствии с реальной ситуацией при обучении кода?

Недавно я столкнулся с проблемой при запуске исходного кода (здесь) по метаобучению: я хочу увидеть форму ввода, прежде чем передавать его в модель: print(eps, episode_x.shape, train_input.shape) Ниже будет исходный авторский код, который использует…
19 июл '22 в 06:50
0 ответов

Исчезающие параметры в MAML JAX (метаобучение)

Я работаю над реализацией MAML (см. https://arxiv.org/pdf/1703.03400.pdf ) в Jax. При обучении распределению простых задач линейной регрессии кажется, что все работает нормально (требуется некоторое время, чтобы сходиться, но в конечном итоге работа…
17 окт '22 в 02:06
0 ответов

Как эффективно объединить несколько наборов данных для решения с помощью метаобучения?

Я решаю проблему метаобучения, используя алгоритм рептилий, как здесь. У меня есть два набора данных. Один содержит следующие классы: радужная оболочка, зрачок и склера вместе с их аннотациями. Другой содержит следующие классы: радужная оболочка, зр…
0 ответов

Применение метаобучения для нейронного машинного перевода

Кто-нибудь знает, как применить метаобучение для нейронного машинного перевода? Я читал несколько статей, в которых несколько языковых пар рассматривались как разные задачи метаобучения. Можно ли это сделать только с одной парой языков? например, пе…
31 янв '23 в 19:05
1 ответ

Слишком большие колебания кривой F1 Score во время мета-тренировки с MAML

Я тренируюсь на пользовательском наборе данных изображений для трехсторонней классификации изображений с 5 кадрами, используя fromlearn2learn. Я инкапсулирую весьVGG11модель сMAML, т.е. не только заголовок классификации. Мои гиперпараметры следующие…
0 ответов

Потеря метаобучения не уменьшается

Когда я использую набор данных CIFAR-FS для обучения простой модели метаобучения, код работает, но потери не уменьшаются, а модель не сходится. Как мне заставить код работать успешно? Это мои коды: from tensorflow.keras.models import Model from tens…
17 июл '22 в 08:21
0 ответов

Сегментация изображения с использованием алгоритма MAML (одинаковые объекты существуют во всех задачах)

У меня есть проблема с сегментацией медицинских изображений из n-дублей k-shots. -Задачи: Различные органы человека, например: печень, селезенка, доброта и т. д. - Снимки: 10 КТ-сканов изображений NIFTI, где все задачи (человеческие органы) присутст…
0 ответов

бинарная классификация в [Триплет | Прототип] нейронная сеть

Я совершенно новичок в концепции обучения с несколькими выстрелами, и я здесь запутался. Проблема Я обучил сеть CNN проецировать звуковые образцы (набор данных команд Google Speech) в 64-мерный вывод на основе концепции прототипной нейронной сети (в…