Получение 10 лучших последовательностей результатов BLAST Bio Python
Я хочу получить 10 лучших последовательностей результатов BLAST (только последовательности, без выравнивания, оценки, электронного значения и т. Д.). Я ввожу текстовый файл, содержащий 5 быстрых файлов. Таким образом, мой вывод должен быть топ-10 бласт-хитов каждого файла fastta.. поэтому мой выходной файл будет иметь 50 последовательностей.
Я читаю каждый мой входной файл fasta через Bio.SeqIO, записываю его как temp.faa, а затем передаю в командную строку BLAST через подпроцесс как
blastp -db nr -query temp.faa -out out.faa -evalue 0.001 -gapopen 11 -gapextend 1 -matrix BLOSUM62 -remote -outfmt 2
на выходе есть много другой информации. Должен ли я проанализировать этот вывод сейчас или есть лучший способ.
Спасибо
PS XML может быть способом, но я не нашел соответствующий синтаксис синтаксического анализатора NCBIXML.
1 ответ
Решения на BioStar StackExchange:
http://biostar.stackexchange.com/questions/9880/getting-top-10-sequences-of-blast-results-bio-python
http://biostar.stackexchange.com/questions/9882/parsing-blast-output-biopython-error