LDA в Python для компьютерного зрения

Я работаю над контентным поиском изображений с использованием тематического моделирования LDA(скрытое распределение Дирихле). Я хочу использовать Python для того же. Я не могу найти какие-либо библиотеки / пакеты в Python для LDA для набора данных изображений. Этот пакет, кажется, работает только для текстового корпуса. Пожалуйста, предложите любые пакеты в Python для корпусов изображений или кратко перечислите шаги, необходимые для выполнения LDA для изображений.

1 ответ

Недавно я реализовал поиск изображений с использованием LDA в Python на основе визуальных слов. Посмотрите на моей странице GitHub для деталей.

Визуальные слова - это кластерные центры объектов изображения, выделенных в ключевых точках изображения. В этом примере плотные элементы SIFT извлекаются из коллекции из 10 изображений лиц 40 разных людей (набор данных лиц Olivetti).

128-мерные элементы SIFT сгруппированы с помощью мини-пакетных K-средних в словарь из K визуальных слов. Онлайновый вариационный алгоритм Байеса используется для изучения тематической модели LDA и извлечения пропорций тем для данных обучающих изображений.

Затем данные тестового изображения преобразуются в пространство тем, и обучающие изображения извлекаются на основе косинусного сходства между тематическими пропорциями поезда и тестовых изображений.

Другие вопросы по тегам