Как автоматически изменить длинные имена генов на сокращенные (обработка данных на микрочипах)?

Есть ли автоматический способ преобразования списка длинных названий генов (например, Cadherin_3453) в его сокращения, например, CDHRN_3453? Существуют ли условные обозначения в геномике, биоинформатике?

Извините, здесь нет кода

2 ответа

Существует база данных HUGO, которая пытается стандартизировать имена генов. В зависимости от вашего варианта использования вы можете каждый раз пытаться получить доступ к их онлайн-поиску или загрузить данные и использовать свою собственную базу данных.

Поскольку вы не опубликовали нужный вам язык программирования, я предполагаю, что это просто одноразовое упражнение, которое вы хотели бы выполнить.

Хотя это не настоящее сокращение, вы можете просто удалить все гласные в названии гена (как вы, возможно, сделали случайно в своем примере).

Вы должны использовать:

http://www.togglecase.com/convert_to_disemvowelled_text.php

Удалось изменить Cadherin_3453 в Cdhrn_3453,

Если вы ищете возможность сделать это с помощью программы, которую вы можете адаптировать к вашим конкретным потребностям, вы можете посмотреть на этот ТАК вопрос: String заменять гласные в Python?

Другие вопросы по тегам