Парсинг файла GenBank с несколькими записями

Я был бы рад, если бы кто-нибудь мог помочь мне получить следующий код для вывода последовательностей (включая идентификаторы) всех записей во входном файле ( http://biopython.org/DIST/docs/tutorial/examples/ls_orchid.gbk):

use Bio::SeqIO;
use Bio::Seq;
use Bio::DB::GenBank;

$seq_obj = Bio::SeqIO->new(-file => "ls_orchid.gbk" , '-format' => 'genbank');
$seqio_obj2 = Bio::SeqIO->new(-file => '>sequence.fasta', -format => 'genbank' );

while ( my $seq = $seq_obj->next_seq() ) {
print "Sequence ",$seq->id ($seq_obj)"\n";
#print $seq_obj->seq,"\n";
$seqio_obj2->write_seq($seq_obj);
}

Я хотел бы видеть вывод, состоящий из чисто последовательностей (предпочтительно с заголовками) следующим образом:

seq1:
ATTCGCTGCATGACAT..........
Seq2:
ACTGCGATGGATGGAT..

Спасибо

0 ответов

Другие вопросы по тегам