Парсинг файла GenBank с несколькими записями
Я был бы рад, если бы кто-нибудь мог помочь мне получить следующий код для вывода последовательностей (включая идентификаторы) всех записей во входном файле ( http://biopython.org/DIST/docs/tutorial/examples/ls_orchid.gbk):
use Bio::SeqIO;
use Bio::Seq;
use Bio::DB::GenBank;
$seq_obj = Bio::SeqIO->new(-file => "ls_orchid.gbk" , '-format' => 'genbank');
$seqio_obj2 = Bio::SeqIO->new(-file => '>sequence.fasta', -format => 'genbank' );
while ( my $seq = $seq_obj->next_seq() ) {
print "Sequence ",$seq->id ($seq_obj)"\n";
#print $seq_obj->seq,"\n";
$seqio_obj2->write_seq($seq_obj);
}
Я хотел бы видеть вывод, состоящий из чисто последовательностей (предпочтительно с заголовками) следующим образом:
seq1:
ATTCGCTGCATGACAT..........
Seq2:
ACTGCGATGGATGGAT..
Спасибо