Устранить избыточность в списке с помощью Perl

Привет! Я создал этот скрипт для извлечения всего типа из файла OTU, полученного из qiime с использованием базы данных silva. Я добавил подпрограмму для удаления дублирующегося таксона и извлечения всего лишнего (один из каждого таксона), моя проблема в том, что я просто получаю строку las (только один таксон)

#!/usr/bin/perl -w
use strict;
use Getopt::Long;

my ($imput, $output, $line, $phylum, @taxon_list, @final_list);
GetOptions (
           'in=s'    =>\$imput,
           'ou=s'   =>\$output,
           'k'      =>\$phylum,

           );

if (!$imput or !$output){
    exit;
    print "Error";
}



#SUBRUTINE TO ELIMINATE DUPLICATES
# --------------------------------------------------------------------------------------------
sub uniq {
  my %seen;
  grep !$seen{$_}++, @_;
}
# --------------------------------------------------------------------------------------------

open INPUTFILE, "<", "$imput", or die "can`t open file\n";
open OUTPUTFILE, ">", "$output" or die "can`t creat file\n";

while (<INPUTFILE>){
$line=$_;
chomp($line);
    if ($line=~ m/^#/g){
        next;
    }
    elsif($phylum){
        my @kingd=($line=~m/D_1__(.*);D_2/g);
        foreach (@kingd){
            if ($_=~/^$/){
                next;
            }
            elsif ($_=~ m/^[Uu]nknown/g){
                next;
                }
            elsif ($_=~ m/^[Uu]ncultured$/g){
                next;
            }
            elsif ($_=~ m/^[Uu]nidentified$/g){

            }
            else {
                @taxon_list =$_;

                    @final_list = uniq @taxon_list;
            }
        }
    }
}

print OUTPUTFILE "@final_list\n";

close INPUTFILE;
close OUTPUTFILE;
exit;

1 ответ

Решение

Я подозреваю, что проблема с:

@taxon_list =$_;

Он не добавляется, а перезаписывается текущим элементом.

Пытаться:

push @taxon_list, $_;

Вы также можете переместить следующее за пределы цикла:

@final_list = uniq @taxon_list;
Другие вопросы по тегам