Описание тега meta-learning
1
ответ
Когда следует вызывать .eval () и .train () при выполнении MAML с более высокой библиотекой PyTorch?
Я просматривал пример omniglot maml и увидел, что у них net.train()в верхней части их тестового кода . Это похоже на ошибку, поскольку это означает, что статистика каждой задачи при мета-тестировании является общей: def test(db, net, device, epoch, …
04 ноя '21 в 23:30
0
ответов
Как использовать среднее и стандартное значение из обучения в Batch Norm?
Я хотел использовать средства, stds из обучения, а не пакетную статистику, поскольку кажется, что если я использую пакетную статистику, моя модель расходится (как здесь показаноКогда следует вызывать .eval() и .train () при выполнении MAML с более в…
05 ноя '21 в 01:56
0
ответов
Не удалось вычислить градиент в PyTorch
Я читал этот исследовательский документ — https://arxiv.org/abs/1908.00413 и пытался реализовать код из GitHub — https://github.com/hoyeoplee/MeLU, однако столкнулся с ошибкой времени выполнения. при обучении модели. Может ли кто-нибудь предложить в…
20 янв '22 в 09:04
0
ответов
Будет ли создание «данных» градиента путем их отсоединения реализовать MAML первого порядка с использованием более высокой библиотеки PyTorch?
Я использовал более высокую библиотеку pytorch для MAML и хотел запустить MAML первого порядка. Я до сих пор не понимал, что track_higher_grads(вероятно, моя ошибка, потому что в прошлом я находил документы запутанными, например, см. Что означает до…
01 фев '22 в 23:21
0
ответов
Несколько tf.GradientTape на одном уровне дают градиент NaN
Я выполняю этапы обучения метаобучению, в то время как мне нужно выполнить два отдельных градиентных спуска, используя tf.GradientTapeдля support_set и query_set на одном уровне. но оказывается, что градиент, вычисленный для цикла набора запросов, д…
29 ноя '21 в 13:18
0
ответов
Почему PyTorch не может найти все параметры для градиентного спуска с помощью MAML и библиотеки Learn2learn? (все параметры должны быть обновлены)
Я использовал структуру Learn2learn для метаобучения и получил эту ошибку: Traceback (most recent call last): File "/home/miranda9/miniconda3/envs/meta_learning_a100/lib/python3.9/site-packages/learn2learn/algorithms/maml.py", line 159, in adapt gra…
25 фев '22 в 19:51
1
ответ
Метаобучение для поиска оптимальной модели из предварительно обученных моделей в Tensorflow
У меня много предварительно обученных моделей с разным количеством слоев (Модели не являются последовательными). Данные обучения имели форму (1, 1, 103) для этих моделей, а выходные данные представляли собой метку класса от 0 до 9. Я загрузил эти со…
17 фев '22 в 13:03
0
ответов
вещи, связанные с метаобучением, работают только в pytorch? мы не можем использовать библиотеки tensorflow
вещи, связанные с метаобучением, работают только в pytorch? мы не можем использовать библиотеки tensorflow
29 май '22 в 17:12
1
ответ
Почему RandomCrop с размером 84 и отступом 8 возвращает размер изображения 84, а не 100 в pytorch?
Я использовал набор данных mini-imagenet и заметил эту строку кода: elif data_augmentation == 'lee2019: normalize = Normalize( mean=[120.39586422 / 255.0, 115.59361427 / 255.0, 104.54012653 / 255.0], std=[70.68188272 / 255.0, 68.27635443 / 255.0, 72…
12 май '22 в 00:18
0
ответов
PyTorch: неявные градиенты возвращают (нет) метаградиент
Я пытаюсь реализовать алгоритм неявных градиентов [1, 2, 3] для оптимизации некоторых метапараметров (в моем случае параметров функции потерь). Однако создаваемые (мета-)градиенты всегда равны None. Могу ли я получить некоторую помощь в определении …
23 мар '22 в 03:43
1
ответ
Как разделить классы в классификации нескольких выстрелов с помощью CIFAR-10?
Я хочу обучить модель, которая выполняет классификацию изображений с несколькими снимками с использованием CIFAR-10. Поэтому мне приходится тренировать модель с небольшим количеством классов, а остальные классы использовать для тестирования. Мне инт…
21 июл '22 в 09:31
0
ответов
ValueError: График отключен: невозможно получить значение для тензора KerasTensor(type_spec=TensorSpec(shape=(None, None, None, 3)
Я работаю над подходом MetaLearning к решению проблемы сегментации изображения. Я обучил 7 разных моделей на разных классах, связанных с набором данных о глазах, предоставленным Oculus SBVPI (радужная оболочка, зрачок, склера, кантус, периокуляр, со…
29 ноя '22 в 11:26
0
ответов
Будет ли pytorch корректировать порядок кода в соответствии с реальной ситуацией при обучении кода?
Недавно я столкнулся с проблемой при запуске исходного кода (здесь) по метаобучению: я хочу увидеть форму ввода, прежде чем передавать его в модель: print(eps, episode_x.shape, train_input.shape) Ниже будет исходный авторский код, который использует…
19 июл '22 в 06:50
0
ответов
Исчезающие параметры в MAML JAX (метаобучение)
Я работаю над реализацией MAML (см. https://arxiv.org/pdf/1703.03400.pdf ) в Jax. При обучении распределению простых задач линейной регрессии кажется, что все работает нормально (требуется некоторое время, чтобы сходиться, но в конечном итоге работа…
17 окт '22 в 02:06
0
ответов
Как эффективно объединить несколько наборов данных для решения с помощью метаобучения?
Я решаю проблему метаобучения, используя алгоритм рептилий, как здесь. У меня есть два набора данных. Один содержит следующие классы: радужная оболочка, зрачок и склера вместе с их аннотациями. Другой содержит следующие классы: радужная оболочка, зр…
10 ноя '22 в 17:22
0
ответов
Применение метаобучения для нейронного машинного перевода
Кто-нибудь знает, как применить метаобучение для нейронного машинного перевода? Я читал несколько статей, в которых несколько языковых пар рассматривались как разные задачи метаобучения. Можно ли это сделать только с одной парой языков? например, пе…
31 янв '23 в 19:05
1
ответ
Слишком большие колебания кривой F1 Score во время мета-тренировки с MAML
Я тренируюсь на пользовательском наборе данных изображений для трехсторонней классификации изображений с 5 кадрами, используя fromlearn2learn. Я инкапсулирую весьVGG11модель сMAML, т.е. не только заголовок классификации. Мои гиперпараметры следующие…
26 дек '22 в 07:55
0
ответов
Потеря метаобучения не уменьшается
Когда я использую набор данных CIFAR-FS для обучения простой модели метаобучения, код работает, но потери не уменьшаются, а модель не сходится. Как мне заставить код работать успешно? Это мои коды: from tensorflow.keras.models import Model from tens…
17 июл '22 в 08:21
0
ответов
Сегментация изображения с использованием алгоритма MAML (одинаковые объекты существуют во всех задачах)
У меня есть проблема с сегментацией медицинских изображений из n-дублей k-shots. -Задачи: Различные органы человека, например: печень, селезенка, доброта и т. д. - Снимки: 10 КТ-сканов изображений NIFTI, где все задачи (человеческие органы) присутст…
26 фев '23 в 21:14
0
ответов
бинарная классификация в [Триплет | Прототип] нейронная сеть
Я совершенно новичок в концепции обучения с несколькими выстрелами, и я здесь запутался. Проблема Я обучил сеть CNN проецировать звуковые образцы (набор данных команд Google Speech) в 64-мерный вывод на основе концепции прототипной нейронной сети (в…
15 авг '22 в 09:27