Неотрицательная матричная факторизация (NMF или NNMF), а также неотрицательная матричная аппроксимация - это группа алгоритмов в многомерном анализе и линейной алгебре, где матрица V факторизуется (обычно) на две матрицы W и H со свойством, что все три матрицы не имеют отрицательных элементов.
1 ответ

Как сравнить прогнозирующую способность PCA и NMF

Я хотел бы сравнить выходные данные алгоритма с различными предварительно обработанными данными: NMF и PCA. Чтобы получить какой-то сопоставимый результат, вместо того, чтобы выбирать одинаковое количество компонентов для каждого PCA и NMF, я хотел …
0 ответов

Создание прогностической модели на основе 3 столбцов

У меня есть набор данных, который имеет 3 столбца. Клиент, Магазин и количество раз, когда покупатель совершал покупки в конкретном магазине. Here's a subset of my data: 3 291 1 3 311 1 3 242 1 3 272 1 3 351 1 3 487 1 6 121 1 6 134 1 6 615 1 6 154 2…
0 ответов

Неотрицательная матричная факторизация (NMF) для смешанных данных с использованием горячего кодирования 1

С точки зрения интерпретации, могу ли я использовать NMF для однозначно закодированных категориальных данных для уменьшения размера? Я смешал данные и думал об одномоментном кодировании категориальных признаков и о минимальном максимуме, нормализующ…
09 окт '18 в 16:48
1 ответ

Почему параметр random_state используется в алгоритмах NMF и LDA? Каковы преимущества использования случайных тем, генерируемых каждый раз?

Для тематического моделирования,Почему параметр random_state используется в алгоритмах NMF и LDA? Каковы преимущества использования случайных тем, генерируемых каждый раз?
08 фев '19 в 06:28
0 ответов

NMF в R не соответствует цифрам

Я хочу использовать NMF для разложения (части) рукописных данных. Но это дает мне ошибку. Я не уверен, что не так. Ниже приведен код, который выдает ошибку вместе с информацией о R-сессии. Обратите внимание, что те же данные могут быть обработаны с …
04 окт '18 в 19:54
1 ответ

Scikit-Learn Неотрицательная матричная факторизация (NMF) для разреженной матрицы

Я использую неотрицательную матричную факторизацию Scikit-learn (NMF) для выполнения NMF на разреженной матрице, где в нулевых записях отсутствуют данные. Мне было интересно, рассматривает ли реализация NMF Scikit-learn нулевые записи как 0 или проп…
21 фев '17 в 02:09
1 ответ

Очень большая и очень редкая факторизация неотрицательной матрицы

У меня очень большая и тоже разреженная матрица (531K x 315K), общее количество ячеек составляет ~167 млрд. Ненулевые значения только 1 с. Общее количество ненулевых значений составляет около 45К. Существует ли эффективный пакет NMF для решения моей…
0 ответов

Необходимо выполнить моделирование темы и вывести результаты на лист CSV

У меня есть следующий код для моделирования тем, и мне нужно взять текстовые данные из файла CSV и сгруппировать их в 2 темы, названные Тема 0 и Тема 1: Input: Website name, Text Output: Website name, Text, Topic from sklearn.feature_extraction.text…
04 сен '17 в 13:08
1 ответ

Использование scikit-learn NMF с предварительно вычисленным набором базисных векторов (Python)

Я хочу использовать scikit-learn NMF ( отсюда) (или любой другой NMF, если он действительно выполняет свою работу). В частности, у меня есть входная матрица (которая является спектрограммой величины звука), и я хочу разложить ее. У меня уже есть пре…
10 июн '17 в 22:29
2 ответа

Как удалить None из результата функции?

Извините, но я до сих пор не могу решить эту проблему. Я использую алгоритм NMF для создания тем корпуса, а затем пытаюсь получить документы, прикрепленные к каждой теме. Но никто не мешает мне! Когда я пытаюсь получить документы, у меня появляется …
17 сен '18 в 10:21
3 ответа

Как просмотреть исходный код алгоритма NMF в R?

Я довольно новый, используя R, я должен запрограммировать новый алгоритм NMF, который будет использоваться в качестве параметра method когда функция nmf() называется. Для начала я хотел бы просмотреть исходный код встроенных алгоритмов как brunet, K…
16 ноя '16 в 11:31
0 ответов

Как заставить разреженность на H в sklearn.decomposition.NMF, учитывая, что X ~=W*H?

Мне нужно сделать H разреженным, а именно: учитывая X ~= W*H, мы хотим, чтобы H было разреженным. model1 = NMF(n_components=rank, init='random', random_state=0, max_iter=9000) W = model1.fit_transform(X) H = model1.components_ Глядя на scikit docs, …
15 апр '18 в 20:07
0 ответов

Рекомендательная система - неоднозначные пользователи / предметы

Системный набор данных My Recommender содержит сведения о сети точек данных (около 10 000), где каждый элемент данных может быть как "пользователем", так и "элементом" (если использовать широко используемую терминологию). В действительности, к каждо…
24 май '18 в 23:20
0 ответов

Решение большой линейной системы с NNMF

Мне было интересно, возможно ли решение больших линейных систем уравнений после факторизации неотрицательной матрицы. Я использую NNMF вместо LU или другой факторизации, потому что мне нужны только положительные коэффициенты.
06 ноя '18 в 13:01
0 ответов

Определите оставшуюся дисперсию в каждом компоненте в неотрицательной матричной факторизации (NMF)

Мне было интересно, возможно ли определить дисперсию, сохраняющуюся в каждом компоненте NMF. Например, используя PCA, это можно определить следующим образом: 'retainedVariance(i) = собственное значение (i) / сумма (собственное значение)' где собстве…
2 ответа

MATLAB nnmf() - матрица больших терминов для документов - проблема с памятью и скоростью

У меня большая матрица терм-документов, и я хочу использовать неотрицательную матричную функцию факторизации, которую предлагает Matlab. Проблема в том, что после 1-й итерации использование памяти быстро растет и достигает вершины (моя система имеет…
21 авг '12 в 13:55
0 ответов

Как вернуть V-матрицу (словарь) из sklearn.decomposition.DictionaryLearning fit()

Глядя на код в dict_learning.py ( https://github.com/scikit-learn/scikit-learn), функция fit() обнаруживает U, V среди прочего: V, U, E, self.n_iter_ = dict_learning( ... Но это только сохраняет U для будущего доступа (через self.componenets_). Вопр…
12 апр '18 в 14:35
2 ответа

R NMF пакет: Как извлечь классификацию образцов?

В R-пакете NMF можно использовать consensusmap() для визуализации результатов. Графики показывают, какие образцы принадлежат к каким кластерам в "консенсусном" треке. Я хотел бы извлечь этот пример классификации так, чтобы я получил кадр данных, как…
20 ноя '16 в 12:58
0 ответов

Управление количеством процессоров, используемых матричными факторизациями scikit-learn (NMF, ICA)

Я использую несколько алгоритмов факторизации матрицы scikit-learn v20s на машине с Ubuntu 16.04. Я обнаружил, что независимо от количества процессоров, доступных на моей машине, NMF и ICA будут использовать ровно половину из них. Например, запустив…
11 окт '18 в 17:48
1 ответ

Как передать функцию R в качестве аргумента, используя rpy2 в коде Python

Я пытаюсь создать интерфейс Python для блестящего пакета NMF - https://cran.r-project.org/web/packages/NMF/NMF.pdf (поскольку он гораздо более гибкий, чем параметры Python). Все идет нормально. Я придумываю что-то вроде этого: # Python rpy2 __NMF = …
26 янв '17 в 04:08