Как получить все идентификаторы ChEBI для данного соединения KEGG?

Допустим, я хочу сопоставить идентификатор KEGG с идентификатором ChEBI, используя bioservices, Я могу сделать:

from bioservices import *

kegg_con = KEGG()
kegg_entry = kegg_con.parse(kegg_con.get('C00033'))
print(kegg_entry['DBLINKS']['ChEBI'].split())

Это вернется

[u'15366', u'30089']

Это означает, что есть два идентификатора ChEBI, связанных с соединением KEGG ( запись KEGG C00033).

Альтернатива - если нужно сделать много отображений - это использовать встроенный конвертер, например так:

map_kegg_chebi = kegg_con.conv("chebi", "compound")
print(map_kegg_chebi['cpd:C00033'])

Это напечатает

u'chebi:15366'

Таким образом, для одного и того же соединения возвращается только один идентификатор, хотя есть два ассоциированных с этим соединением. Есть ли способ получить их обоих?

1 ответ

Решение

Короче говоря, у меня нет ответа, но вот некоторая информация, которая может вам помочь.

Запись C00033 показывает две связанные сущности в базе данных CHEBI: 15366 и 30089. Теперь, если мы посмотрим на веб-сайт CHEBI, мы увидим, что эти две записи соответствуют:

ацетат представляет собой ион, возникающий в результате потери H+ из уксусной кислоты.

почему KEGG решил предоставить две записи: я не знаю.

Используя kegg_con.conv, мы можем видеть, что C00033 отображает только один результат в chebi, что мне кажется разумным (но я смущаюсь, что я согласен), поскольку 30089 - это только ионная форма уксусной кислоты (15366).

Для полноты заметим, что используя сервис ChEBI (от bioservices), мы можем сопоставить две записи ChEBI с KEGG, и мы видим, что:

from bioservices import ChEBI
chebi = ChEBI()
chebi.conv("CHEBI:30089", "KEGG COMPOUND accession")
chebi.conv("CHEBI:15366", "KEGG COMPOUND accession")

возвращает C00033 в обоих случаях! Однако в этом примере я бы сказал, что вы не теряете много информации, игнорируя ионную форму уксусной кислоты.

Было бы интересно систематически проверять, что другие неоднозначные отображения также попадают в эту категорию (ионные формы)

Другие вопросы по тегам