Факторный анализ с использованием MDP в Python
Извините за мое невежество, я очень плохо знаком с Python. Я пытаюсь выполнить факторный анализ в Python с использованием MDP (хотя я могу использовать другую библиотеку, если есть лучшее решение).
У меня есть матрица m на n (называемая матрицей), и я попытался сделать:
import mdp
mdp.nodes.FANode()(matrix)
но я получаю обратно ошибку. Я предполагаю, что, возможно, моя матрица сформирована неправильно? Моя цель - узнать, сколько компонентов содержится в данных, и выяснить, какие строки загружают в какие компоненты.
Вот обратная связь:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "mdp/signal_node.py", line 630, in __call__
return self.execute(x, *args, **kwargs)
File "mdp/signal_node.py", line 611, in execute
self._pre_execution_checks(x)
File "mdp/signal_node.py", line 480, in _pre_execution_checks
self.train(x)
File "mdp/signal_node.py", line 571, in train
self._check_input(x)
File "mdp/signal_node.py", line 429, in _check_input
if not x.ndim == 2:
AttributeError: 'list' object has no attribute 'ndim'
Кто-нибудь имеет представление о том, что происходит, и испытываете желание объяснить это новичку в Python?
2 ответа
У меня нет абсолютно никакого опыта работы с mdp, но похоже, что он ожидает, что ваши матрицы будут переданы в виде массива Numpy вместо списка. Numpy - это пакет для высокопроизводительных научных вычислений. Вы можете перейти на домашнюю страницу Numpy и установить ее. После этого попробуйте изменить свой код следующим образом:
import mdp, numpy
mdp.nodes.FANode()(numpy.array(matrix))
Как сказал Стивен, данные должны быть массивом. Точнее, это должен быть двумерный массив с первым индексом, представляющим различные выборки, и вторым индексом, представляющим измерения данных (использование неправильного порядка здесь может привести к ошибке "особой матрицы").
Вы также должны взглянуть на документацию MDP, которая должна ответить на все ваши вопросы. Если это не помогает, есть список рассылки пользователей MDP.