Описание тега dimensionality-reduction

В машинном обучении и статистике уменьшение размерности или уменьшение размерности - это процесс уменьшения количества рассматриваемых случайных величин, который можно разделить на выбор характеристик и извлечение признаков.
1 ответ

Как сравнить прогнозирующую способность PCA и NMF

Я хотел бы сравнить выходные данные алгоритма с различными предварительно обработанными данными: NMF и PCA. Чтобы получить какой-то сопоставимый результат, вместо того, чтобы выбирать одинаковое количество компонентов для каждого PCA и NMF, я хотел …
1 ответ

Как извлечь векторы пространственных объектов меньшего размера из шумоподобного сложенного автоэнкодера, используя python и tenorflow

Приведенный ниже код импортирует набор данных MNIST и обучает сложный шумоподавляющий автоэнкодер повреждать, кодировать, а затем декодировать данные. По сути, я хочу использовать это как метод нелинейного уменьшения размеров. Как я могу получить до…
3 ответа

Свертка для уменьшения размерности одномерного вектора

В CNN, если выходные данные являются одномерным вектором (скажем, предварительным логическим уровнем), как можно уменьшить размерность до указанного размера, используя только свертки? Как получить размеры фильтра / поле восприятия для выполнения так…
1 ответ

Я получаю неожиданное значение NaN при попытке pd.concat. Как с этим бороться? PCA против T-SNE

Я пытаюсь уменьшить размерность данных с помощью PCA, однако, когда я использую concat, он автоматически генерирует значение NaN. Также возраст клиента стал плавать, пока он был int. Может кто-нибудь сказать, пожалуйста, как я могу решить эту пробле…
1 ответ

Как я могу узнать, какие размеры являются основным компонентом?

Я использую функцию princomp в Matlab для PCA. Насколько я понимаю, я мог проверить латентность, чтобы решить, сколько измерений мне нужно. [coeff, score, latent, t2] = princomp(fdata); cumsum(latent)./sum(latent); И с помощью trainMatrix = coeff(:,…
0 ответов

В одном наборе данных я могу применить PCA отдельно один раз для каждого из двух наборов столбцов из-за ограничений памяти

У меня есть набор данных с двумя наборами столбцов. Один набор имеет категориальные столбцы (о различных характеристиках продукта). Этот набор столбцов будет преобразован в фиктивные переменные (одноразовый кодировщик). и количество результирующих с…
14 дек '17 в 08:29
1 ответ

Как проанализировать результат t-SNE(KMeans) в Python?

Я использовал t-SNE для кластеризации KMeans, но после получения результата t-SNE я не мог понять, как я могу связать это с моими исходными данными. Может ли кто-нибудь помочь мне понять результат, и что мне делать дальше, чтобы лучше понять результ…
1 ответ

Почему уменьшение размерности улучшает неконтролируемую кластеризацию киноплакатов?

Я пишу статью, в которой я пытаюсь группировать постеры фильмов на основе их визуальных особенностей. Цель состоит в том, чтобы объединить постеры фильмов, которые выглядят одинаково. Чтобы получить количественное описание того, как "выглядят" плака…
1 ответ

Простой анализ соответствия в Python

Как я могу запустить простой анализ соответствия (CA) в Python? В библиотеке sklearn имеются только варианты множественного анализа корреспонденции (MCA) и канонического анализа соответствия (CCA). Однако мои данные не являются категориальными и не …
1 ответ

Как делать случайные проекции в LSH, когда есть числовые и категориальные данные?

Примечание. Использование LSH для запроса ближайшего соседа Предполагая, что набор данных имеет 5 функций (f1,f2,..,f5), где первые 2 являются числовыми, а 3 - категориальными. И одна или многие из этих категорий могут быть чем-то вроде имени пользо…
0 ответов

Сокращение SVD на разреженной матрице действительно неэффективно в Python

Я думаю, что я в значительной степени понял теорию SVD, тем не менее у меня возникают некоторые проблемы и некоторые сомнения, когда я пытаюсь реализовать ее в python, чтобы уменьшить разреженную матрицу. Я использую функцию sparsesvd (я также пробо…
1 ответ

Видимо случайная векторная графика: ТСНЭ

Я успешно создал векторную модель, используя библиотеку Gensim's word2vec. Расстояние между связанными векторами хорошее (то есть, что производное сходство имеет смысл с человеческой точки зрения). Однако попытка отобразить эти векторы на графе оказ…
2 ответа

Использование уменьшения размерности на матрице

Для контролируемого обучения мой размер матрицы действительно огромен, в результате чего только некоторые модели соглашаются работать с ним. Я читал, что PCA может помочь уменьшить размерность в значительной степени. Ниже мой код: def run(command): …
0 ответов

Как анализ топологических данных связан с уменьшением размерности?

Я попытался найти ключевые идеи TDA, которые связаны с уменьшением размерности, но не смог найти никаких источников для этого.
25 июн '18 в 09:10
1 ответ

Сверточный автоэнкодер для анализа длинных одномерных последовательностей

У меня есть набор данных 1-D векторов, каждый длиной 3001 цифра. Я использовал простую сверточную сеть для выполнения двоичной классификации этих последовательностей: shape=train_X.shape[1:] model = Sequential() model.add(Conv1D(75,3,strides=1, inpu…
2 ответа

Установка параметров метода локально линейного вложения (LLE) в Scikit-learn для уменьшения размерности

Я использую метод локально-линейного вложения (LLE) в Scikit-learn для уменьшения размерности. Единственный пример, который я смог найти, относится к документации Scikit-learn здесь и здесь, но я не уверен, как мне выбрать параметры метода. В частно…
1 ответ

Форма PCA .fit_transform Scikit-learn является несовместимой (n_samples << m_attributes)

Я получаю разные формы для моего PCA, используя sklearn, Почему мое преобразование не приводит к массиву тех же размеров, что и документы? fit_transform(X, y=None) Fit the model with X and apply the dimensionality reduction on X. Parameters: X : arr…
0 ответов

Оценка сигма для ядра rbf-SVM

Я работаю на сервере пакетов MSVM для классификации с использованием ядра rbf. В этом пакете можно изменить параметр сигмы (также известный как bandwidth в машинном обучении, и он равен (1/gamma)) для ядра rbf. Читая документацию этого пакета, я наш…
1 ответ

Как получить результаты `skbio` PCoA (Анализ основных координат)?

Я смотрю на attributes из skbio's PCoA метод (указан ниже). Я новичок в этом API и я хочу быть в состоянии получить eigenvectors и исходные точки проецируются на новую ось, аналогичную .fit_transform в sklearn.decomposition.PCA так что я могу создат…
0 ответов

PCA через ковариационную матрицу и PCA через SVD в python - как получить равные результаты

Я хочу выполнить PCA и мой набор данных XT.shape -&gt;(2500,260) Строки комплекса X содержат выборки (2500), столбцы X содержат переменные (260). Я выполняю SVD так: (Python) u, s, vh = np.linalg.svd(XT) proj_0 = np.dot(XT,vh)[:,0] Думаю, это даст м…
16 янв '18 в 10:58