Иерархическая кластеризация микрочипов и PCA с питоном

Я пытаюсь проанализировать данные микрочипов, используя иерархическую кластеризацию столбцов микрочипов (результаты отдельных копий микрочипов) и PCA.

Я новичок в питоне. У меня есть Python 2.7.3, biopyhton, numpy, matplotlib и networkx.

Существуют ли функции в python или biopython (аналогично кластерной диаграмме MATLAB и mapcaplot), которые я могу использовать для этого?

4 ответа

Решение

Python отлично подходит для нейробиологии, поздравляю на ваш выбор. Иногда найти ресурсы труднее, чем для Matlab, но они бесплатны, вы найдете активное сообщество и большую поддержку.

Хорошей отправной точкой будет проект Neuroimaging in Python и его подпроекты, например, nitime. Я рекомендую подписаться и спросить в списке рассылки, эти ребята очень умные и любят помогать.

Для PCA вы также можете попробовать Modular Toolkit для обработки данных в Python, отличную библиотеку алгоритмов обработки данных.

Для кластеризации в целом, я рекомендую Scipy Clustering.

HTH, Торстен

Я рекомендую использовать R Bioconductor и бесплатное программное обеспечение, такое как Expander и MeV. Хороший гибкий выбор - программное обеспечение кластера с TreeViews. Вы также можете запускать R и STATA или JMP из ваших кодов Python и полностью автоматизировать управление данными.

В R имеется большой набор инструментов, позволяющих выполнять именно то, что вы описываете, при анализе микрочипов с иерархической кластеризацией. Вот ссылка на курс, который я взял, который подробно описывает, как проводить анализ микрочипов с R. Надеюсь, это поможет!

Я использовал scikit-learn для кластеризации и других приложений машинного обучения в python. Я обнаружил, что подход scikit, как правило, интуитивно понятен, и, к счастью, все работает прямо из коробки.

Существует ряд доступных алгоритмов кластеризации, включая агломерационную кластеризацию, которая является одним из подходов иерархической кластеризации.

В дополнение к кластеризации существует множество алгоритмов машинного обучения, как контролируемых, так и неконтролируемых. Существуют также различные инструменты, поддерживающие извлечение функций, перекрестную проверку и т. Д. Инструменты предварительной обработки включают PCA и многое другое.

Определенно стоит проверить.

Другие вопросы по тегам