Ошибка компиляции Perl

Извините, если это кажется очевидным, но я довольно новичок в Perl и программировании, и я работаю более недели и не могу этого сделать. Моя идея проста. У меня есть.csv, где у меня есть имена в первом столбце, число от -1 до 1 во втором и позиция в третьем. Затем другой файл, где у меня есть имена (строка начинается с>) и информация с 80 символами в строке.

То, что я хочу сделать, это сохранить строки имени первого файла и захватить "позицию", заданную от -20 до +60. Но я не могу заставить его работать, и я дошел до того, что не знаю, куда ему следовать.

use strict;                 #read file line by line
use warnings;
my $outputfile = "Output1.txt";
my $filename = "InputP.txt";
my $inputfasta = "Inputfasta.txt";
open my $fh, '<', $filename or die "Couldn't open '$filename'";
open my $fh2, '>', $outputfile or die "Couldn't create '$outputfile'";
open my $fh3, '<', $inputfasta or die "Couldn't open '$inputfasta'";
my $Psequence = 0;
my $seqname = 0;

while (my $line = <$fh>) {
chomp $line;
my $length = index ($line, ",");
$seqname = substr ($line, 0, $length);  

my $length2 = index ($line, ",", $length);
my $score = substr ($line, $length +1, $length2);   

my $length3 = index ($line, ",", $length2);
my $position = substr ($line, $length2 +1, $length3);   

#print $fh2 "$seqname"."\t"."$score"."\t"."$position"."\n";  }

my $Rlength2 = index ($score, ",");
my $Rscore = substr ($score, 0, $Rlength2);
#print "$Rscore"."\n";}
        while (my $linea = <$fh3>){  #same order.

            chomp $linea;
                if ($linea=~/^>(.+)/) { 
                    print $fh3 "\n"."$linea"."\n"; }
                else { $linea =~ /^\s*(.*)\s*$/;
                    chomp $linea;
                    print $fh3 "$linea". "\n"; }   
                    }
                if ($Rscore >= 0.5){
                    $Psequence = substr ($linea, -20, 81); 
                    print "$seqname"."\n"."$Psequence";}
        }

2 ответа

Пожалуйста, научитесь правильно вставлять код. Тогда ошибка будет более очевидной:

while (my $linea = <$fh3>){  #same order.
    chomp $linea;
    if ($linea =~ /^>(.+)/) { 
        print $fh3 "\n$linea\n";
    } else {
        # Commented out as it does nothing.
        # $linea =~ /^\s*(.*)\s*$/;
        # chomp $linea;
        print $fh3 "$linea\n";
    }   
}

if ($Rscore >= 0.5){
    $Psequence = substr $linea, -20, 81; 
    print "$seqname\n$Psequence";
}

$linea существует только в цикле while, но вы попытаетесь использовать его и в следующем абзаце. Переменная исчезает, когда цикл заканчивается.

Создайте хэш из CSV, где ключ - это имя, а значение - это позиция.

use Text::CSV_XS qw( );

my %pos_by_name;
{
   open(my $fh, '<', $input_qfn)
      or die("Can't open $input_qfn: $!\n");

   my $csv = Text::CSV_XS->new({ auto_diag => 1, binary => 1 });
   while (my $row = $csv_in->getline($fh)) {
      $pos_by_name{ $row->[0] } = $row->[2];
   }
}

Тогда это просто вопрос извлечения имен из другого файла и использования хеша для поиска соответствующей позиции.

open(my $fh, '<', $fasta_qfn)
   or die("Can't open $fasta_qfn: $!\n");

while (<$fh>) {
   chomp;
   my ($name) = /^>(.*)/
      or next;

   my $pos = $pos_by_name{$name};
   if (!defined($pos)) {
      die("Can't find position for $name\n");
   }

   ... Do something with $name and $pos ...
}
Другие вопросы по тегам