Описание тега faster-rcnn

Faster-RCNN - это очень распространенная архитектура региональной сверточной нейронной сети, которая обнаруживает и распознает объекты на изображениях за один прямой проход.
0 ответов

Как проверить распределение памяти и чтение файла изображения.jpg в коде caffe и где находится начальная точка в коде caffe?

1) Я установил и смог запустить код caffe в ubantu os, а также смог отладить код с помощью gdb. Но с чего начать и как найти, где происходило чтение изображения и операция свертки. 2) Многие функции main() находятся в caffe, поэтому кто-нибудь может…
01 мар '19 в 07:45
0 ответов

Resnet50 высокая точность?

Кто-нибудь достиг высокой точности, используя Resnet50 на Keras? Я пробовал VGG16 и Xception и добился высокой точности, но по какой-то причине с resnet50 точность проверки низкая и не меняется
0 ответов

Где я могу получить набор поддельных человеческих лиц для обучения?

Для проверки Real Face мне нужен набор данных, состоящий из поддельных изображений человеческого лица. Это необходимо для обучения модели против спуфинга. где я могу найти один?
0 ответов

Сравнение SVM и CNN

Я ищу подходящий набор данных изображений для обучения SVM, CNN и, возможно, MLP в качестве классификаторов и сравнения результатов. Поскольку SVM архивирует хорошие результаты с небольшими наборами данных, а CNN и, прежде всего, MLP, требует очень …
1 ответ

Замораживание весов в сети VGG19 для трансферного обучения в кафе

Причина, по которой я задаю этот вопрос, связана с тем, что в VGG19 есть уровни нормализации партии (в отличие, например, от VGG16). Я пытаюсь обучить сеть Faster-RCNN в Кафе. Я делаю это путем: Загрузка предварительно обученной модели VGG19 ImageNe…
23 фев '19 в 18:09
1 ответ

Какой внешний алгоритм используется для генерации гипотез в Fast R-CNN и SPP-сети?

Я понял, что нам нужен выборочный поиск в качестве внешнего алгоритма для генерации предложений области интереса в R-CNN, но в Fast R-CNN мы можем просто взять все изображение и затем передать его в сверточную сеть для создания карты объектов, а зат…
1 ответ

Задача обнаружения таблицы (TableBank & Detectron): UnicodeDecodeError: кодек "ascii" не может декодировать байт 0x80 в позиции 0: порядковый номер не в диапазоне (128)

Я пытался запустить скрипт Python для тестирования предварительно обученной модели (ResNeXt-101) и визуализации производительности задачи обнаружения таблиц, предложенной TableBank. Авторы провели предварительную подготовку модели с использованием б…
0 ответов

Экспорт моей модели и кода Tensorflow на другой компьютер

Я сослался на ряд учебных пособий и построил модель обнаружения объектов с использованием Faster-RCNN в виртуальной среде Anaconda. Теперь я хочу показать эту модель и найти проблему, когда я запускаю ее на другой системе без Anaconda, я пытаюсь зап…
0 ответов

Установка скорости обучения для Faster R-CNN

Я обучил Faster R-CNN (ResNet101, предварительно обученный на MS COCO) для шагов 50K с 5K пользовательских изображений. Я использовал SGD с импульсом (0,9). Скорость обучения составляла 0,0003 для шагов 10К, затем я уменьшил ее до 0,00003 для шагов …
0 ответов

cudnn_relu_layer.cu:24] Проверка не пройдена: статус == CUDNN_STATUS_SUCCESS (3 против 0) CUDNN_STATUS_BAD_PARAM

Когда я использую caffe-gpu для запуска py-fast-rcnn, я получаю эту ошибку. Это, как известно, производится плохими версиями cuda или cudnn. Так что я проверил их, и они в курсе. (Cuda: 8.0.61 Cudnn: 6.0.21) Кто-нибудь может мне помочь? Большое спас…
07 мар '19 в 13:40
0 ответов

Получение определений уровней для MobileNetV2 в Tensorflow для FasterRCNN

В реализации Tensterflow FasterRCNN для MobileNetV1 есть эта функция, чтобы получить определение уровня def _get_mobilenet_conv_no_last_stride_defs(conv_depth_ratio_in_percentage): if conv_depth_ratio_in_percentage not in [25, 50, 75, 100]: raise Va…
10 мар '19 в 05:04
1 ответ

ValueError: невозможно преобразовать массив размером 1048576 в форму (1024,1024,3)

Ниже приведен фрагмент кода из файла.ipynb. for image_path in TEST_IMAGE_PATHS: print(image_path) image = Image.open(image_path) print('yooo') # the array based representation of the image will be used later in order to prepare the # result image wi…
12 мар '19 в 16:39
1 ответ

Как сделать так, чтобы обнаружение объектов тензорного потока работало быстрее на Android?

У меня есть вопрос об API обнаружения объектов Tensorflows. Я обучил модель Faster R-CNN Inception v2 со своим собственным набором данных для классификации дорожных знаков и хочу развернуть ее на Android, но API обнаружения объектов Tensorflows для …
0 ответов

Обозначение обучающего изображения для моделей обнаружения объектов мультикласса

Я пытаюсь построить модель, обнаруживающую другой тип шампуня, как на картинке. Может ли это изображение использоваться в качестве обучающих данных? Если так, я должен маркировать все продукты на этом, или 1 на тип шампуня?
1 ответ

Обнаружение объекта Tensorflow Ошибка файла train_config

Поэтому я пытаюсь переобучить модель обнаружения объекта fast_rcnn, используя только один класс, который я пытался запустить как локально (на виртуальной машине), так и через механизм ML. Я продолжаю сталкиваться с одной и той же ошибкой в ​​отношен…
1 ответ

Как разделить пополам pydicom файлы (изображения) с помощью python?

У меня много картинок (pydicom файлов). Я хотел бы разделить пополам. Из 1 изображения мне бы хотелось 2 изображения: часть слева и часть справа. Вход: 1000x1000 Выход: 500x1000 (ширина х высота). В настоящее время я могу только читать файл. ds = py…
23 мар '19 в 00:31
1 ответ

Как создать график потерь из загруженных весов? (model.load_weights) Как добавить model.load_weights в историю?

Я хотел бы создать потерю. (сюжет) Я использую Mask-RCNN. Я загрузил веса из моей модели. Но я не могу создать функцию потерь. Я получил ошибку: 'Model' object has no attribute 'history' model = modellib.MaskRCNN(mode="training", config=config, mode…
1 ответ

Каковы именно потери в Matterport Mask-R-CNN?

Я использую Mask-R-CNN для обучения своих данных с ним. Когда я использую TensorBoard, чтобы увидеть результат, у меня возникают потери, mrcnn_bbox_loss, mrcnn_class_loss, mrcnn_mask_loss, rpn_bbox_loss, rpn_class_loss и все те же 6 потерь для прове…
1 ответ

py:445: UserWarning: Matplotlib в настоящее время использует agg, который не является GUI, поэтому не может показать рисунок. % get_backend())

Я пытался запустить репозиторий Mask-RCNN, предоставляемый материальным портом в Github. https://github.com/matterport/Mask_RCNN. когда я запускаю демо в анаконде, оно показало "C:\Anaconda\lib\site-packages\matplotlib\figure.py:445: UserWarning: Ma…
30 мар '19 в 16:33
0 ответов

Учебная маска RCNN, но всегда получаете 0 положительных ограничивающих рамок из всех предложений?

Я только что внедрил маску RCNN в Pytorch с нуля, и вот код: https://github.com/arthurhero/Mask_R-CNN_Pytorch/blob/master/masker_ops.py У меня есть только один GTX1080 и один Quadro6000 на двух разных машинах, поэтому я могу тренироваться только с 2…