Получение 10 лучших последовательностей результатов BLAST Bio Python

Я хочу получить 10 лучших последовательностей результатов BLAST (только последовательности, без выравнивания, оценки, электронного значения и т. Д.). Я ввожу текстовый файл, содержащий 5 быстрых файлов. Таким образом, мой вывод должен быть топ-10 бласт-хитов каждого файла fastta.. поэтому мой выходной файл будет иметь 50 последовательностей.

Я читаю каждый мой входной файл fasta через Bio.SeqIO, записываю его как temp.faa, а затем передаю в командную строку BLAST через подпроцесс как

blastp -db nr -query temp.faa -out out.faa -evalue 0.001 -gapopen 11 -gapextend 1 -matrix BLOSUM62 -remote -outfmt 2

на выходе есть много другой информации. Должен ли я проанализировать этот вывод сейчас или есть лучший способ.

Спасибо

PS XML может быть способом, но я не нашел соответствующий синтаксис синтаксического анализатора NCBIXML.

1 ответ

Решение
Другие вопросы по тегам