Описание тега custom-training

3 ответа

OOM при выделении тензора с формой [1,48,48,1024] и типом float on /job:localhost/replica:0/task:0/device:GPU:0 с помощью распределителя GPU_0_bfc

Я пытаюсь воспроизвести обучение RCNN маски в следующем репозитории: https://github.com/maxkferg/metal-defect-detection Фрагмент кода поезда следующий: # Training - Stage 1 print("Training network heads") model.train(dataset_train, dataset…
0 ответов

Train_on_batch, сохранение скрытого представления в списке

У меня есть следующий код for t in range (9400): autoencoder.compile(loss='binary_crossentropy', optimizer='rmsprop') output_layers = ['latent_outputs'] autoencoder.metrics_tensors = [latent_outputs] x = [layer.output for layer in autoencoder.layers…
05 мар '20 в 21:38
1 ответ

Почему в этой статье "фильтры" установлены как (классы + 5) * 3?

Вот руководство по индивидуальному обучению YOLO (Darknet): https://medium.com/@manivannan_data/how-to-train-yolov3-to-detect-custom-objects-ccbcafeb13d2 В учебнике рассказывается, как установить значения в .cfg файлы: classes = Количество классов, …
1 ответ

Ограничение вывода нейронной сети в произвольном диапазоне

У меня есть настраиваемая нейронная сеть, которую я обучаю на данных и стремлюсь ограничить выходные значения сети, чтобы они всегда находились между двумя произвольными константами: [lower_bound,upper_bound]. Есть ли какие-либо передовые методы код…
0 ответов

TypeError: преобразование должно быть вызываемым или dict mmdet #mmdetection

Я работаю над проектом по настройке счетов-фактур на поезда для обнаружения таблиц и использую модель cascade_mask_rcnn_hrnetv2p_w32_20e_coco. Я слежу за https://colab.research.google.com/github/Tony607/mmdetection_object_detection_demo/blob/master/…
0 ответов

При использовании пользовательского набора данных для Darkflow xml.etree.ElementTree.ParseError: неверно сформированный (недопустимый токен): строка 4, столбец 8

В настоящее время я пытаюсь обучить пользовательский набор данных в darkflow, я получаю эту ошибку каждый раз (ниже). Я уже провел несколько стандартных тестов, чтобы убедиться, что репозиторий работает в первую очередь, попробовав примеры кодов, ко…
02 авг '20 в 09:45
1 ответ

простой начальный блок в pytorch, требующий гораздо больше времени для обучения на GPU?

Я тренирую очень простой начальный блок, за которым следует maxpool и полностью подключенный уровень на графическом процессоре NVIDIA GeForce RTX 2070, и его итерация занимает очень много времени. Только что закончили 10 итераций более чем за 24 час…
0 ответов

Настройка функции fit () в keras приводит к тому, что функция Assessment () возвращает пустой список

Я тренирую VAE с помощью учебника Keras: https://keras.io/examples/generative/vae/. Это включает в себя создание класса VAE и определение пользовательской процедуры обучения, которая подробно описана здесь: https://keras.io/guides/customizing_what_h…
0 ответов

Включите прямой проход, а затем функцию потерь для пакета обучающих данных вместо отдельных данных

Я написал модель нейронной сети с ответом на вопрос, используя Keras с TensorFlow. Ниже приводится краткое описание входов, выходов и функции потерь моей модели: Два входа в мою модель, Контекст и Запрос, имеют формы (number_of_samples, number_conte…
1 ответ

Интерактивное обучение моделей в Pytorch

Мне нужно тренировать две модели параллельно. Каждая модель имеет свою функцию активации с обучаемыми параметрами. Я хочу обучить модель 1 и модель 2 таким образом, чтобы параметры функции активации модели 1 (например, alpha1) отделялись от параметр…
1 ответ

Как построить историю показателей обучения в Sagemaker .py Training

Я использую ноутбук в Sagemaker и использую файл.py для обучения: tf_estimator = TensorFlow(entry_point='train_cnn.py', role=role, train_instance_count=1, train_instance_type='local', #We use the local instance framework_version='1.12', py_version='…
0 ответов

Как переписать регрессионную модель и код Keras для обучения в Tensorflow 1.12 или 1.15?

Я использую настраиваемую модель регрессии Keras с несколькими входами (числовые данные и данные изображения) и метод flow_from_dataframe для загрузки обучающих данных. Мне нужно переписать модель и код для обучения в Tensorflow v1.12 или 1.15. Есть…
21 авг '20 в 13:03
0 ответов

How to execute a portion of graph in TensorFlow 1.X

I'm trying to implement the Co-Teaching Algorithm in TensorFlow 1.15: https://papers.nips.cc/paper/8072-co-teaching-robust-training-of-deep-neural-networks-with-extremely-noisy-labels.pdf. Короче говоря, цель состоит в том, чтобы обучить две сети од…
03 апр '20 в 18:50
1 ответ

Расчет прямого прохода для текущего пакета в методе "get_updates" в Keras SGD Optimizer

Я пытаюсь реализовать правило стохастического armijo в методе get_gradient оптимизатора Keras SGD. Поэтому мне нужно рассчитать еще один прямой проход, чтобы проверить, была ли выбранная скорость обучения хорошей. Мне не нужен еще один расчет градие…
0 ответов

Градиенты равны нулю, кроме первой итерации в тензорном потоке

Когда я инициализирую модель и вычисляю градиент на первой итерации (я выполняю индивидуальное обучение), эти матрицы заполняются ненулевыми числами, после того, как градиенты первой итерации равны нулю, я не понимаю этого, потому что я сделал это, …
0 ответов

API обнаружения объектов Tensorflow с переносом обучения для пользовательских классов - все ли веса слоев обновляются с конфигурацией по умолчанию?

Я использую tenorflow Object Detection API версии 1.13, я взял предварительно обученную модель ssd_inceptionv2_coco из зоопарка модели обнаружения объектов tensorflow и хочу обучить свои 200 пользовательских изображений двух разных классов, которые …
0 ответов

Нейронной сети требуется время для обучения даже после замораживания всех слоев

В тензорном потоке после того, как я установил обучаемый флаг каждого слоя на False, попытка обучения сети не изменила веса (как и ожидалось). Однако для каждой эпохи по-прежнему требуется одинаковое количество времени (около 12 секунд) для трениров…
23 июн '20 в 00:10
0 ответов

Spacy: обучить POS tagger после токенизации

Я пытаюсь обучить теггер POS spaCy после настройки токенизатора. Например, токенизация текста "Il est culotté celui-là". сейчас ['Il', 'est', 'culotté', 'celui-là', '.'] а не исходный:['Il', 'est', 'culotté', 'celui', '-', 'là', '.'] Моя проблема в …
14 июл '20 в 15:31
1 ответ

Ошибки при обучении моей сохраненной модели тензорного потока

Я пытаюсь создать собственную модель keras с помощью API подкласса, но у меня возникают некоторые ошибки, когда я загружаю предыдущий экземпляр моей модели и пытаюсь обучить его: Вот класс моей модели, у него 3 входа и 1 выход: import tensorflow as …
1 ответ

Пользовательский генератор данных Tensorflow2.x с многопроцессорностью

Я только что обновился до tenorflow 2.3. Я хочу сделать собственный генератор данных для обучения. С tenorflow 1.x я сделал следующее: def get_data_generator(test_flag): item_list = load_item_list(test_flag) print('data loaded') while True: X = [] Y…