Производительность семантической сегментации: мультикласс против двухкласса

Мы разрабатываем приложение для семантической сегментации для ПК и мобильной платформы. Первоначально мы опробовали современную платформу DeeplabV3+ от google. В качестве набора данных использовался POCAL VOC, и модель из официального зоопарка модели очень хорошо работала в Условия точности (тензорный поток). Производительность модели на ПК и мобильных устройствах (в пересчете на coreml и tflite) была неудовлетворительной в соответствии с нашими требованиями. Несмотря на то, что мы пробовали разные методы оптимизации и квантования моделей, мы не смогли достичь хорошего баланса между производительность и точность.

Однако на самом деле нас интересует только сегментация отдельного класса (в пределах PASCAL VOC). Но модель вычисляет маску сегментации для каждой из меток классов, которая в нашем случае представляется избыточной. Итак, если мы обучаем сеть только с одним классом (дополнительный фон), это улучшит производительность с точки зрения скорости?

1 ответ

Безусловно, это улучшит скорость с точки зрения того, что ему не придется тратить дополнительное время на сегментацию других классов, если это не тот класс, который вам нужен, он будет двигаться вперед.

Другие вопросы по тегам