Описание тега custom-training
3
ответа
OOM при выделении тензора с формой [1,48,48,1024] и типом float on /job:localhost/replica:0/task:0/device:GPU:0 с помощью распределителя GPU_0_bfc
Я пытаюсь воспроизвести обучение RCNN маски в следующем репозитории: https://github.com/maxkferg/metal-defect-detection Фрагмент кода поезда следующий: # Training - Stage 1 print("Training network heads") model.train(dataset_train, dataset…
17 авг '20 в 17:04
0
ответов
Train_on_batch, сохранение скрытого представления в списке
У меня есть следующий код for t in range (9400): autoencoder.compile(loss='binary_crossentropy', optimizer='rmsprop') output_layers = ['latent_outputs'] autoencoder.metrics_tensors = [latent_outputs] x = [layer.output for layer in autoencoder.layers…
05 мар '20 в 21:38
1
ответ
Почему в этой статье "фильтры" установлены как (классы + 5) * 3?
Вот руководство по индивидуальному обучению YOLO (Darknet): https://medium.com/@manivannan_data/how-to-train-yolov3-to-detect-custom-objects-ccbcafeb13d2 В учебнике рассказывается, как установить значения в .cfg файлы: classes = Количество классов, …
27 фев '20 в 10:05
1
ответ
Ограничение вывода нейронной сети в произвольном диапазоне
У меня есть настраиваемая нейронная сеть, которую я обучаю на данных и стремлюсь ограничить выходные значения сети, чтобы они всегда находились между двумя произвольными константами: [lower_bound,upper_bound]. Есть ли какие-либо передовые методы код…
24 июн '20 в 22:12
0
ответов
TypeError: преобразование должно быть вызываемым или dict mmdet #mmdetection
Я работаю над проектом по настройке счетов-фактур на поезда для обнаружения таблиц и использую модель cascade_mask_rcnn_hrnetv2p_w32_20e_coco. Я слежу за https://colab.research.google.com/github/Tony607/mmdetection_object_detection_demo/blob/master/…
24 июл '20 в 21:42
0
ответов
При использовании пользовательского набора данных для Darkflow xml.etree.ElementTree.ParseError: неверно сформированный (недопустимый токен): строка 4, столбец 8
В настоящее время я пытаюсь обучить пользовательский набор данных в darkflow, я получаю эту ошибку каждый раз (ниже). Я уже провел несколько стандартных тестов, чтобы убедиться, что репозиторий работает в первую очередь, попробовав примеры кодов, ко…
02 авг '20 в 09:45
1
ответ
простой начальный блок в pytorch, требующий гораздо больше времени для обучения на GPU?
Я тренирую очень простой начальный блок, за которым следует maxpool и полностью подключенный уровень на графическом процессоре NVIDIA GeForce RTX 2070, и его итерация занимает очень много времени. Только что закончили 10 итераций более чем за 24 час…
04 авг '20 в 06:53
0
ответов
Настройка функции fit () в keras приводит к тому, что функция Assessment () возвращает пустой список
Я тренирую VAE с помощью учебника Keras: https://keras.io/examples/generative/vae/. Это включает в себя создание класса VAE и определение пользовательской процедуры обучения, которая подробно описана здесь: https://keras.io/guides/customizing_what_h…
25 авг '20 в 05:52
0
ответов
Включите прямой проход, а затем функцию потерь для пакета обучающих данных вместо отдельных данных
Я написал модель нейронной сети с ответом на вопрос, используя Keras с TensorFlow. Ниже приводится краткое описание входов, выходов и функции потерь моей модели: Два входа в мою модель, Контекст и Запрос, имеют формы (number_of_samples, number_conte…
05 мар '20 в 09:37
1
ответ
Интерактивное обучение моделей в Pytorch
Мне нужно тренировать две модели параллельно. Каждая модель имеет свою функцию активации с обучаемыми параметрами. Я хочу обучить модель 1 и модель 2 таким образом, чтобы параметры функции активации модели 1 (например, alpha1) отделялись от параметр…
19 май '20 в 13:23
1
ответ
Как построить историю показателей обучения в Sagemaker .py Training
Я использую ноутбук в Sagemaker и использую файл.py для обучения: tf_estimator = TensorFlow(entry_point='train_cnn.py', role=role, train_instance_count=1, train_instance_type='local', #We use the local instance framework_version='1.12', py_version='…
12 июл '20 в 03:52
0
ответов
Как переписать регрессионную модель и код Keras для обучения в Tensorflow 1.12 или 1.15?
Я использую настраиваемую модель регрессии Keras с несколькими входами (числовые данные и данные изображения) и метод flow_from_dataframe для загрузки обучающих данных. Мне нужно переписать модель и код для обучения в Tensorflow v1.12 или 1.15. Есть…
21 авг '20 в 13:03
0
ответов
How to execute a portion of graph in TensorFlow 1.X
I'm trying to implement the Co-Teaching Algorithm in TensorFlow 1.15: https://papers.nips.cc/paper/8072-co-teaching-robust-training-of-deep-neural-networks-with-extremely-noisy-labels.pdf. Короче говоря, цель состоит в том, чтобы обучить две сети од…
03 апр '20 в 18:50
1
ответ
Расчет прямого прохода для текущего пакета в методе "get_updates" в Keras SGD Optimizer
Я пытаюсь реализовать правило стохастического armijo в методе get_gradient оптимизатора Keras SGD. Поэтому мне нужно рассчитать еще один прямой проход, чтобы проверить, была ли выбранная скорость обучения хорошей. Мне не нужен еще один расчет градие…
06 июн '20 в 17:12
0
ответов
Градиенты равны нулю, кроме первой итерации в тензорном потоке
Когда я инициализирую модель и вычисляю градиент на первой итерации (я выполняю индивидуальное обучение), эти матрицы заполняются ненулевыми числами, после того, как градиенты первой итерации равны нулю, я не понимаю этого, потому что я сделал это, …
18 авг '20 в 21:05
0
ответов
API обнаружения объектов Tensorflow с переносом обучения для пользовательских классов - все ли веса слоев обновляются с конфигурацией по умолчанию?
Я использую tenorflow Object Detection API версии 1.13, я взял предварительно обученную модель ssd_inceptionv2_coco из зоопарка модели обнаружения объектов tensorflow и хочу обучить свои 200 пользовательских изображений двух разных классов, которые …
06 июн '20 в 19:32
0
ответов
Нейронной сети требуется время для обучения даже после замораживания всех слоев
В тензорном потоке после того, как я установил обучаемый флаг каждого слоя на False, попытка обучения сети не изменила веса (как и ожидалось). Однако для каждой эпохи по-прежнему требуется одинаковое количество времени (около 12 секунд) для трениров…
23 июн '20 в 00:10
0
ответов
Spacy: обучить POS tagger после токенизации
Я пытаюсь обучить теггер POS spaCy после настройки токенизатора. Например, токенизация текста "Il est culotté celui-là". сейчас ['Il', 'est', 'culotté', 'celui-là', '.'] а не исходный:['Il', 'est', 'culotté', 'celui', '-', 'là', '.'] Моя проблема в …
14 июл '20 в 15:31
1
ответ
Ошибки при обучении моей сохраненной модели тензорного потока
Я пытаюсь создать собственную модель keras с помощью API подкласса, но у меня возникают некоторые ошибки, когда я загружаю предыдущий экземпляр моей модели и пытаюсь обучить его: Вот класс моей модели, у него 3 входа и 1 выход: import tensorflow as …
09 авг '20 в 01:24
1
ответ
Пользовательский генератор данных Tensorflow2.x с многопроцессорностью
Я только что обновился до tenorflow 2.3. Я хочу сделать собственный генератор данных для обучения. С tenorflow 1.x я сделал следующее: def get_data_generator(test_flag): item_list = load_item_list(test_flag) print('data loaded') while True: X = [] Y…
14 окт '20 в 18:33