Описание тега meta-learning

Вопросы с тегом

1 ответ

Когда следует вызывать .eval () и .train () при выполнении MAML с более высокой библиотекой PyTorch?

Я просматривал пример omniglot maml и увидел, что у них net.train()в верхней части их тестового кода . Это похоже на ошибку, поскольку это означает, что статистика каждой задачи при мета-тестировании является общей: def test(db, net, device, epoch, …

04 ноя '21 в 23:30

0 ответов

Как использовать среднее и стандартное значение из обучения в Batch Norm?

Я хотел использовать средства, stds из обучения, а не пакетную статистику, поскольку кажется, что если я использую пакетную статистику, моя модель расходится (как здесь показаноКогда следует вызывать .eval() и .train () при выполнении MAML с более в…

machine-learning deep-learning pytorch meta-learning higher

05 ноя '21 в 01:56

0 ответов

Не удалось вычислить градиент в PyTorch

Я читал этот исследовательский документ — https://arxiv.org/abs/1908.00413 и пытался реализовать код из GitHub — https://github.com/hoyeoplee/MeLU, однако столкнулся с ошибкой времени выполнения. при обучении модели. Может ли кто-нибудь предложить в…

deep-learning pytorch neural-network meta-learning

20 янв '22 в 09:04

0 ответов

Будет ли создание «данных» градиента путем их отсоединения реализовать MAML первого порядка с использованием более высокой библиотеки PyTorch?

Я использовал более высокую библиотеку pytorch для MAML и хотел запустить MAML первого порядка. Я до сих пор не понимал, что track_higher_grads(вероятно, моя ошибка, потому что в прошлом я находил документы запутанными, например, см. Что означает до…

machine-learning deep-learning pytorch meta-learning higher

01 фев '22 в 23:21

0 ответов

Несколько tf.GradientTape на одном уровне дают градиент NaN

Я выполняю этапы обучения метаобучению, в то время как мне нужно выполнить два отдельных градиентных спуска, используя tf.GradientTapeдля support_set и query_set на одном уровне. но оказывается, что градиент, вычисленный для цикла набора запросов, д…

python tensorflow keras tf.keras meta-learning

29 ноя '21 в 13:18

0 ответов

Почему PyTorch не может найти все параметры для градиентного спуска с помощью MAML и библиотеки Learn2learn? (все параметры должны быть обновлены)

Я использовал структуру Learn2learn для метаобучения и получил эту ошибку: Traceback (most recent call last): File "/home/miranda9/miniconda3/envs/meta_learning_a100/lib/python3.9/site-packages/learn2learn/algorithms/maml.py", line 159, in adapt gra…

machine-learning deep-learning pytorch meta-learning learn2learn

25 фев '22 в 19:51

1 ответ

Метаобучение для поиска оптимальной модели из предварительно обученных моделей в Tensorflow

У меня много предварительно обученных моделей с разным количеством слоев (Модели не являются последовательными). Данные обучения имели форму (1, 1, 103) для этих моделей, а выходные данные представляли собой метку класса от 0 до 9. Я загрузил эти со…

python tensorflow keras tensorflow2.0 meta-learning

17 фев '22 в 13:03

0 ответов

вещи, связанные с метаобучением, работают только в pytorch? мы не можем использовать библиотеки tensorflow

machine-learning deep-learning meta-learning

29 май '22 в 17:12

1 ответ

Почему RandomCrop с размером 84 и отступом 8 возвращает размер изображения 84, а не 100 в pytorch?

Я использовал набор данных mini-imagenet и заметил эту строку кода: elif data_augmentation == 'lee2019: normalize = Normalize( mean=[120.39586422 / 255.0, 115.59361427 / 255.0, 104.54012653 / 255.0], std=[70.68188272 / 255.0, 68.27635443 / 255.0, 72…

deep-learning pytorch meta-learning learn2learn l2l

12 май '22 в 00:18

0 ответов

PyTorch: неявные градиенты возвращают (нет) метаградиент

Я пытаюсь реализовать алгоритм неявных градиентов [1, 2, 3] для оптимизации некоторых метапараметров (в моем случае параметров функции потерь). Однако создаваемые (мета-)градиенты всегда равны None. Могу ли я получить некоторую помощь в определении …

pytorch tensor autograd meta-learning

23 мар '22 в 03:43

1 ответ

Как разделить классы в классификации нескольких выстрелов с помощью CIFAR-10?

Я хочу обучить модель, которая выполняет классификацию изображений с несколькими снимками с использованием CIFAR-10. Поэтому мне приходится тренировать модель с небольшим количеством классов, а остальные классы использовать для тестирования. Мне инт…

pytorch artificial-intelligence meta-learning few-shot-learning

21 июл '22 в 09:31

0 ответов

ValueError: График отключен: невозможно получить значение для тензора KerasTensor(type_spec=TensorSpec(shape=(None, None, None, 3)

Я работаю над подходом MetaLearning к решению проблемы сегментации изображения. Я обучил 7 разных моделей на разных классах, связанных с набором данных о глазах, предоставленным Oculus SBVPI (радужная оболочка, зрачок, склера, кантус, периокуляр, со…

deep-learning tensorflow2.0 object-detection image-segmentation meta-learning

29 ноя '22 в 11:26

0 ответов

Будет ли pytorch корректировать порядок кода в соответствии с реальной ситуацией при обучении кода?

Недавно я столкнулся с проблемой при запуске исходного кода (здесь) по метаобучению: я хочу увидеть форму ввода, прежде чем передавать его в модель: print(eps, episode_x.shape, train_input.shape) Ниже будет исходный авторский код, который использует…

python deep-learning pytorch meta-learning

19 июл '22 в 06:50

0 ответов

Исчезающие параметры в MAML JAX (метаобучение)

Я работаю над реализацией MAML (см. https://arxiv.org/pdf/1703.03400.pdf ) в Jax. При обучении распределению простых задач линейной регрессии кажется, что все работает нормально (требуется некоторое время, чтобы сходиться, но в конечном итоге работа…

python machine-learning jax flax meta-learning

17 окт '22 в 02:06

0 ответов

Как эффективно объединить несколько наборов данных для решения с помощью метаобучения?

Я решаю проблему метаобучения, используя алгоритм рептилий, как здесь. У меня есть два набора данных. Один содержит следующие классы: радужная оболочка, зрачок и склера вместе с их аннотациями. Другой содержит следующие классы: радужная оболочка, зр…

tensorflow deep-learning image-segmentation meta-learning few-shot-learning

10 ноя '22 в 17:22

0 ответов

Применение метаобучения для нейронного машинного перевода

Кто-нибудь знает, как применить метаобучение для нейронного машинного перевода? Я читал несколько статей, в которых несколько языковых пар рассматривались как разные задачи метаобучения. Можно ли это сделать только с одной парой языков? например, пе…

resources translation limit meta-learning nmt

31 янв '23 в 19:05

1 ответ

Слишком большие колебания кривой F1 Score во время мета-тренировки с MAML

Я тренируюсь на пользовательском наборе данных изображений для трехсторонней классификации изображений с 5 кадрами, используя fromlearn2learn. Я инкапсулирую весьVGG11модель сMAML, т.е. не только заголовок классификации. Мои гиперпараметры следующие…

deep-learning pytorch meta-learning few-shot-learning learn2learn

26 дек '22 в 07:55

0 ответов

Потеря метаобучения не уменьшается

Когда я использую набор данных CIFAR-FS для обучения простой модели метаобучения, код работает, но потери не уменьшаются, а модель не сходится. Как мне заставить код работать успешно? Это мои коды: from tensorflow.keras.models import Model from tens…

tensorflow keras meta-learning

17 июл '22 в 08:21

0 ответов

Сегментация изображения с использованием алгоритма MAML (одинаковые объекты существуют во всех задачах)

У меня есть проблема с сегментацией медицинских изображений из n-дублей k-shots. -Задачи: Различные органы человека, например: печень, селезенка, доброта и т. д. - Снимки: 10 КТ-сканов изображений NIFTI, где все задачи (человеческие органы) присутст…

python image-segmentation generalization meta-learning few-shot-learning

26 фев '23 в 21:14

0 ответов

бинарная классификация в [Триплет | Прототип] нейронная сеть

Я совершенно новичок в концепции обучения с несколькими выстрелами, и я здесь запутался. Проблема Я обучил сеть CNN проецировать звуковые образцы (набор данных команд Google Speech) в 64-мерный вывод на основе концепции прототипной нейронной сети (в…

neural-network k-means meta-learning few-shot-learning learn2learn

15 авг '22 в 09:27