Описание тега dimensionality-reduction
В машинном обучении и статистике уменьшение размерности или уменьшение размерности - это процесс уменьшения количества рассматриваемых случайных величин, который можно разделить на выбор характеристик и извлечение признаков.
1
ответ
Как сравнить прогнозирующую способность PCA и NMF
Я хотел бы сравнить выходные данные алгоритма с различными предварительно обработанными данными: NMF и PCA. Чтобы получить какой-то сопоставимый результат, вместо того, чтобы выбирать одинаковое количество компонентов для каждого PCA и NMF, я хотел …
08 янв '18 в 10:46
1
ответ
Как извлечь векторы пространственных объектов меньшего размера из шумоподобного сложенного автоэнкодера, используя python и tenorflow
Приведенный ниже код импортирует набор данных MNIST и обучает сложный шумоподавляющий автоэнкодер повреждать, кодировать, а затем декодировать данные. По сути, я хочу использовать это как метод нелинейного уменьшения размеров. Как я могу получить до…
17 ноя '17 в 22:39
3
ответа
Свертка для уменьшения размерности одномерного вектора
В CNN, если выходные данные являются одномерным вектором (скажем, предварительным логическим уровнем), как можно уменьшить размерность до указанного размера, используя только свертки? Как получить размеры фильтра / поле восприятия для выполнения так…
27 окт '17 в 15:28
1
ответ
Я получаю неожиданное значение NaN при попытке pd.concat. Как с этим бороться? PCA против T-SNE
Я пытаюсь уменьшить размерность данных с помощью PCA, однако, когда я использую concat, он автоматически генерирует значение NaN. Также возраст клиента стал плавать, пока он был int. Может кто-нибудь сказать, пожалуйста, как я могу решить эту пробле…
21 июн '18 в 13:36
1
ответ
Как я могу узнать, какие размеры являются основным компонентом?
Я использую функцию princomp в Matlab для PCA. Насколько я понимаю, я мог проверить латентность, чтобы решить, сколько измерений мне нужно. [coeff, score, latent, t2] = princomp(fdata); cumsum(latent)./sum(latent); И с помощью trainMatrix = coeff(:,…
24 апр '13 в 22:00
0
ответов
В одном наборе данных я могу применить PCA отдельно один раз для каждого из двух наборов столбцов из-за ограничений памяти
У меня есть набор данных с двумя наборами столбцов. Один набор имеет категориальные столбцы (о различных характеристиках продукта). Этот набор столбцов будет преобразован в фиктивные переменные (одноразовый кодировщик). и количество результирующих с…
14 дек '17 в 08:29
1
ответ
Как проанализировать результат t-SNE(KMeans) в Python?
Я использовал t-SNE для кластеризации KMeans, но после получения результата t-SNE я не мог понять, как я могу связать это с моими исходными данными. Может ли кто-нибудь помочь мне понять результат, и что мне делать дальше, чтобы лучше понять результ…
25 июн '18 в 11:43
1
ответ
Почему уменьшение размерности улучшает неконтролируемую кластеризацию киноплакатов?
Я пишу статью, в которой я пытаюсь группировать постеры фильмов на основе их визуальных особенностей. Цель состоит в том, чтобы объединить постеры фильмов, которые выглядят одинаково. Чтобы получить количественное описание того, как "выглядят" плака…
30 окт '18 в 14:59
1
ответ
Простой анализ соответствия в Python
Как я могу запустить простой анализ соответствия (CA) в Python? В библиотеке sklearn имеются только варианты множественного анализа корреспонденции (MCA) и канонического анализа соответствия (CCA). Однако мои данные не являются категориальными и не …
11 июл '17 в 03:24
1
ответ
Как делать случайные проекции в LSH, когда есть числовые и категориальные данные?
Примечание. Использование LSH для запроса ближайшего соседа Предполагая, что набор данных имеет 5 функций (f1,f2,..,f5), где первые 2 являются числовыми, а 3 - категориальными. И одна или многие из этих категорий могут быть чем-то вроде имени пользо…
21 май '15 в 05:55
0
ответов
Сокращение SVD на разреженной матрице действительно неэффективно в Python
Я думаю, что я в значительной степени понял теорию SVD, тем не менее у меня возникают некоторые проблемы и некоторые сомнения, когда я пытаюсь реализовать ее в python, чтобы уменьшить разреженную матрицу. Я использую функцию sparsesvd (я также пробо…
20 окт '17 в 08:28
1
ответ
Видимо случайная векторная графика: ТСНЭ
Я успешно создал векторную модель, используя библиотеку Gensim's word2vec. Расстояние между связанными векторами хорошее (то есть, что производное сходство имеет смысл с человеческой точки зрения). Однако попытка отобразить эти векторы на графе оказ…
01 май '17 в 14:01
2
ответа
Использование уменьшения размерности на матрице
Для контролируемого обучения мой размер матрицы действительно огромен, в результате чего только некоторые модели соглашаются работать с ним. Я читал, что PCA может помочь уменьшить размерность в значительной степени. Ниже мой код: def run(command): …
16 янв '16 в 05:53
0
ответов
Как анализ топологических данных связан с уменьшением размерности?
Я попытался найти ключевые идеи TDA, которые связаны с уменьшением размерности, но не смог найти никаких источников для этого.
25 июн '18 в 09:10
1
ответ
Сверточный автоэнкодер для анализа длинных одномерных последовательностей
У меня есть набор данных 1-D векторов, каждый длиной 3001 цифра. Я использовал простую сверточную сеть для выполнения двоичной классификации этих последовательностей: shape=train_X.shape[1:] model = Sequential() model.add(Conv1D(75,3,strides=1, inpu…
04 авг '18 в 13:57
2
ответа
Установка параметров метода локально линейного вложения (LLE) в Scikit-learn для уменьшения размерности
Я использую метод локально-линейного вложения (LLE) в Scikit-learn для уменьшения размерности. Единственный пример, который я смог найти, относится к документации Scikit-learn здесь и здесь, но я не уверен, как мне выбрать параметры метода. В частно…
16 фев '17 в 13:53
1
ответ
Форма PCA .fit_transform Scikit-learn является несовместимой (n_samples << m_attributes)
Я получаю разные формы для моего PCA, используя sklearn, Почему мое преобразование не приводит к массиву тех же размеров, что и документы? fit_transform(X, y=None) Fit the model with X and apply the dimensionality reduction on X. Parameters: X : arr…
08 июл '16 в 22:08
0
ответов
Оценка сигма для ядра rbf-SVM
Я работаю на сервере пакетов MSVM для классификации с использованием ядра rbf. В этом пакете можно изменить параметр сигмы (также известный как bandwidth в машинном обучении, и он равен (1/gamma)) для ядра rbf. Читая документацию этого пакета, я наш…
14 мар '18 в 15:25
1
ответ
Как получить результаты `skbio` PCoA (Анализ основных координат)?
Я смотрю на attributes из skbio's PCoA метод (указан ниже). Я новичок в этом API и я хочу быть в состоянии получить eigenvectors и исходные точки проецируются на новую ось, аналогичную .fit_transform в sklearn.decomposition.PCA так что я могу создат…
14 июл '16 в 21:10
0
ответов
PCA через ковариационную матрицу и PCA через SVD в python - как получить равные результаты
Я хочу выполнить PCA и мой набор данных XT.shape ->(2500,260) Строки комплекса X содержат выборки (2500), столбцы X содержат переменные (260). Я выполняю SVD так: (Python) u, s, vh = np.linalg.svd(XT) proj_0 = np.dot(XT,vh)[:,0] Думаю, это даст м…
16 янв '18 в 10:58