Получить свойства остатка из файла pdb

У меня есть файл pdb, и я хочу проанализировать pdb, используя python, и я хочу найти следующее для остатков в pdb:

1. hydrophobicity
2. interface topology
3. solvent accessible surface area

Я пытался использовать Pybel

file_name = "4hhb.pdb"
allmols = [mol for mol in pybel.readfile("pdb", file_name)]
for mol in allmols:
    dir(mols)

но я могу видеть только несколько свойств.

'addh', 'atoms', 'calcdesc', 'calcfp', 'charge', 'conformers', 'data', 'dim', 'draw', 'energy', 'exactmass', 'formula', 'localopt', 'make3D', 'molwt', 'removeh', 'spin', 'sssr', 'title', 'unitcell', 'write

Как я могу найти эти 3 свойства из pdb? Я могу использовать любой модуль, доступный в Python, чтобы получить эти свойства.

2 ответа

Гидрофобность (для каждого АА) можно найти в:

Bio.SeqUtils.ProtParamData.kd

kd = {'A': 1.8, 'R':-4.5, 'N':-3.5, 'D':-3.5, 'C': 2.5, 
      'Q':-3.5, 'E':-3.5, 'G':-0.4, 'H':-3.2, 'I': 4.5, 
      'L': 3.8, 'K':-3.9, 'M': 1.9, 'F': 2.8, 'P':-1.6, 
      'S':-0.8, 'T':-0.7, 'W':-0.9, 'Y':-1.3, 'V': 4.2 }

Я предполагаю, что вы должны добавить все значения аминокислот и получить общую гидрофобность.

http://biopython.org/DIST/docs/api/Bio.SeqUtils.ProtParamData-pysrc.html


Вы можете использовать GROMAC ( http://manual.gromacs.org/programs/gmx-sasa.html), чтобы получить два других параметра. Просматривая исходный код C ( https://github.com/gromacs/gromacs/blob/master/src/gromacs/trajectoryanalysis/modules/sasa.cpp), эти параметры далеки от очевидных расчетов.

Я бы завернул gmx_sasa с subprocess.Popen() и получить результаты.

Как уже упоминалось в этом 1 ответе, BioPython 2 обеспечивает поддержку парсинга .pdb файлы

Другие вопросы по тегам