LDA в Python для компьютерного зрения
Я работаю над контентным поиском изображений с использованием тематического моделирования LDA(скрытое распределение Дирихле). Я хочу использовать Python для того же. Я не могу найти какие-либо библиотеки / пакеты в Python для LDA для набора данных изображений. Этот пакет, кажется, работает только для текстового корпуса. Пожалуйста, предложите любые пакеты в Python для корпусов изображений или кратко перечислите шаги, необходимые для выполнения LDA для изображений.
1 ответ
Недавно я реализовал поиск изображений с использованием LDA в Python на основе визуальных слов. Посмотрите на моей странице GitHub для деталей.
Визуальные слова - это кластерные центры объектов изображения, выделенных в ключевых точках изображения. В этом примере плотные элементы SIFT извлекаются из коллекции из 10 изображений лиц 40 разных людей (набор данных лиц Olivetti).
128-мерные элементы SIFT сгруппированы с помощью мини-пакетных K-средних в словарь из K визуальных слов. Онлайновый вариационный алгоритм Байеса используется для изучения тематической модели LDA и извлечения пропорций тем для данных обучающих изображений.
Затем данные тестового изображения преобразуются в пространство тем, и обучающие изображения извлекаются на основе косинусного сходства между тематическими пропорциями поезда и тестовых изображений.