Извлечение файлов sdf из публикации, соответствующей моноизотопной массе

Я пытаюсь извлечь химические структуры из базы данных pubchem в формате sdf соединений, соответствующих определенной точной массе и в диапазоне 10 частей на миллион этой точной массы (точная масса-квадратная масса / точная масса)*10^6. Есть ли способ добиться этого с помощью языков программирования Py thon или Java, взаимодействующих с Pubchem.

1 ответ

PubChem имеет REST API для загрузки химических структур. Чтобы получить составные записи PubChem в пределах заданного диапазона масс, следует инициировать запрос Entrez, чтобы сгенерировать список CID.100:100.01 - диапазон масс для примера.

http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=pccompound&usehistory=y&retmax=0&term=100:100.01[exactmass]

Вы можете сослаться на этот учебник Шлюз для опытных пользователей

Другие вопросы по тегам