Как получить все идентификаторы ChEBI для данного соединения KEGG?
Допустим, я хочу сопоставить идентификатор KEGG с идентификатором ChEBI, используя bioservices
, Я могу сделать:
from bioservices import *
kegg_con = KEGG()
kegg_entry = kegg_con.parse(kegg_con.get('C00033'))
print(kegg_entry['DBLINKS']['ChEBI'].split())
Это вернется
[u'15366', u'30089']
Это означает, что есть два идентификатора ChEBI, связанных с соединением KEGG ( запись KEGG C00033).
Альтернатива - если нужно сделать много отображений - это использовать встроенный конвертер, например так:
map_kegg_chebi = kegg_con.conv("chebi", "compound")
print(map_kegg_chebi['cpd:C00033'])
Это напечатает
u'chebi:15366'
Таким образом, для одного и того же соединения возвращается только один идентификатор, хотя есть два ассоциированных с этим соединением. Есть ли способ получить их обоих?
1 ответ
Короче говоря, у меня нет ответа, но вот некоторая информация, которая может вам помочь.
Запись C00033 показывает две связанные сущности в базе данных CHEBI: 15366 и 30089. Теперь, если мы посмотрим на веб-сайт CHEBI, мы увидим, что эти две записи соответствуют:
- 15366 уксусная кислота
- 30089 ацетат
ацетат представляет собой ион, возникающий в результате потери H+ из уксусной кислоты.
почему KEGG решил предоставить две записи: я не знаю.
Используя kegg_con.conv, мы можем видеть, что C00033 отображает только один результат в chebi, что мне кажется разумным (но я смущаюсь, что я согласен), поскольку 30089 - это только ионная форма уксусной кислоты (15366).
Для полноты заметим, что используя сервис ChEBI (от bioservices), мы можем сопоставить две записи ChEBI с KEGG, и мы видим, что:
from bioservices import ChEBI
chebi = ChEBI()
chebi.conv("CHEBI:30089", "KEGG COMPOUND accession")
chebi.conv("CHEBI:15366", "KEGG COMPOUND accession")
возвращает C00033 в обоих случаях! Однако в этом примере я бы сказал, что вы не теряете много информации, игнорируя ионную форму уксусной кислоты.
Было бы интересно систематически проверять, что другие неоднозначные отображения также попадают в эту категорию (ионные формы)