Чем карта сегментации изображения на основе GAN отличается от методов семантической сегментации SOTA?

Я искал такие статьи, как Pix2Pix и DeeplabV3. В документе pix2pix выполняется задача сегментации изображения. аналогично DeeplabV3 используется для задач сегментации. Я хочу понять, когда мне следует использовать GAN для сегментации, а когда - методы сегментации SOTA. Каковы плюсы и минусы этих методов семантической сегментации?

1 ответ

Думаю, кто-то может найти пример, но я пока не видел, чтобы метод GAN работал лучше, чем современные методы сегментации. На мой взгляд, GAN более интересны для переноса домена или методов со слабым контролем в целом. Однако, если у вас есть набор данных с соответствующими пиксельными аннотациями, я думаю, что вам следует следовать "стандартным" документам по семантической сегментации.
Если вы хотите знать, какие методы в целом работают лучше, я бы порекомендовал вам изучить некоторые задачи компьютерного зрения и проверить, какие методы работают лучше всего (например, kaggle, grand-challenge.org, конференции,...).
На одном веб-сайте интересно отслеживать разные методы на одном графике: https://paperswithcode.com/task/semantic-segmentation
Поэтому, если вам интересно, что лучше всего подойдет для семантической сегментации, я обязательно посоветую вам взглянуть на deeplab, как вы упомянули, или на этот репозиторий, достаточно эффективный.