Ограничения по обнаружению края
Я учусь на информатика и пытаюсь найти тему для моего проекта. Я особенно заинтересован в обнаружении краев, но у меня возникли проблемы с поиском области исследования по этой теме. Я ищу какое-то ограничение обнаружения краев, с которым сталкиваемся сегодня.
Мои идеи пока следующие:
Обработка обнаружения краев на зашумленных изображениях. В настоящее время используется метод сглаживания по Гауссу, но мы по-прежнему не получаем желаемого результата.
Я слышал несколько проблем, обсуждающих обнаружение краев и гештальт-принципы. Но я не нахожу никаких хороших данных или исследовательских работ по этой подтеме.
Кто-нибудь знает о каких-либо проблемах или ограничениях обнаружения краев, которые еще предстоит решить? Не стесняйтесь подробно остановиться на двух подтемах, которые я упомянул выше!
2 ответа
Есть несколько интересных проблем для решения. Если вы решите проблему, которая может привести вас к реализации проекта Capstone и через несколько лет, это может быть интересно для аспирантов и / или будущих работодателей.
Что касается теории Гештальта, посмотрите раннюю книгу в этой области (на английском языке) под названием "Книга источников по психологии гештальта", изданная Уиллисом Д. Эллисом. Вы можете быть удивлены тем, насколько полезными могут быть ранние тексты в поле. То же самое относится и к раннему тексту обработки изображений - иногда ранние учебники дают более четкие, более простые объяснения, чем более поздние учебники.
Так как Гештальт был модным столетие назад, у вас могут возникнуть трудности с поиском оригинальных текстов путем поиска в Google. Поговорите со справочным библиотекарем. Попросите, чтобы увидеть копию руководства по справочникам.
Если вы заинтересованы в том, чтобы продлить свои исследования до завершения кромки, а не просто по обнаружению кромки, то использование спирали Эйлера для завершения кривой - отличное поле. Вот одна статья на эту тему:
"3D-спирали Эйлера для завершения 3D-кривой"
http://webee.technion.ac.il/~ayellet/Ps/10-HT.pdf
В заключение, я хотел бы прочитать статью, в которой кто-то рассматривает использование Кэнни мира "оптимально" и предпочтительно находит термин, который не вводит в заблуждение.
Я только что сделал похожий проект в моей школе. Посмотрите на Сложенные Denoising Auto Encoders. Это новая методика, которая недавно была применена с большим успехом. Это полуобучаемый алгоритм обучения, который использует шум для лучшего понимания данных. Это работает очень хорошо, когда у вас много немаркированных данных и мало помеченных данных.
http://deeplearning.net/tutorial/SdA.html
Андрей нг имеет хорошее видео. У него есть хорошая информация о распознавании изображений и обнаружении краев. Он также проводит бесплатный курс машинного обучения на Itunes U.
https://www.youtube.com/watch?v=n1ViNeWhC24
Это не новаторское новшество, но вы можете найти его интересным и применять его по-новому.
Я почти уверен, что Google использует новую систему кодирования, которую они используют. Был хороший студенческий проект для меня. Я использовал его, чтобы попытаться определить аккорды в музыке из файлов.wav.