Perl - разбить переменную из входных данных на две части для URL
Я загружаю данные из.txt в целях очистки. Тем не менее, URL требует, чтобы я разбил эту переменную и сделал +/- 2 к ней. Например, если значение равно 2342, мне нужно создать 2340 и 2344 для целей URL.
Я догадался, как это разбить:
$args{birth_year} = ($args{birth_year} - 2) . '-' . ($args{birth_year} + 2);
Как мне тогда поместить это в URL?
Вот соответствующая часть кода:
use strict;
use warnings;
use WWW::Mechanize::Firefox;
use Data::Dumper;
use LWP::UserAgent;
use JSON;
use CGI qw/escape/;
use HTML::DOM;
open(my $l, 'locations2.txt') or die "Can't open locations: $!";
while (my $line = <$l>) {
chomp $line;
my %args;
@args{qw/givenname surname birth_place birth_year gender race/} = split /,/, $line;
$args{birth_year} = ($args{birth_year} - 2) . '-' . ($args{birth_year} + 2);
my $mech = WWW::Mechanize::Firefox->new(create => 1, activate => 1);
$mech->get("https://familysearch.org/search/collection/index#count=20&query=%2Bgivenname%3A$args{givenname}20%2Bsurname%3A$args{surname}20%2Bbirth_place%3A$args{birth_place}%20%2Bbirth_year%3A1910-1914~%20%2Bgender%3A$args{gender}20%2Brace%3A$args{race}&collection_id=2000219");
Например
Ввод:
Benjamin,Schuvlein,Germany,1912,M,White
Желаемый URL:
3 ответа
Почему вы не можете просто изменить эту строку:
$mech->get("https://familysearch.org/search/collection/index#count=20&query=%2Bgivenname%3A$args{givenname}20%2Bsurname%3A$args{surname}20%2Bbirth_place%3A$args{birth_place}%20%2Bbirth_year%3A1910-1914~%20%2Bgender%3A$args{gender}20%2Brace%3A$args{race}&collection_id=2000219");
к этому:
$mech->get("https://familysearch.org/search/collection/index#count=20&query=%2Bgivenname%3A$args{givenname}20%2Bsurname%3A$args{surname}20%2Bbirth_place%3A$args{birth_place}%20%2Bbirth_year%3A$args(birth_year)~%20%2Bgender%3A$args{gender}20%2Brace%3A$args{race}&collection_id=2000219");
ПРИМЕЧАНИЕ: я изменил этот бит:
%3A1910-1914~%20
к этому:
%3A$arg(birth_year)~%20
В этом ответе не учитывается необходимость кодирования URL-адресов во входных данных, т. Е. Где-то по пути, если фамилия "von Schtupp", она должна стать "von%20Schtupp"
Я не проверял это, поэтому может быть опечатка или небольшая ошибка. Тем не менее, это подход, который я бы использовал. Мой ответ также предполагает, что вам все равно, в каком порядке появляются критерии поиска.
my %query_params = (
givenname => $args{givenname},
surname => $args{surname},
birth_place => $args{birth_place},
birth_year => sprintf("%d-%d", $args{birth_year} - 2, $args{birth_year} + 2),
gender => $args{gender},
race => $args{race},
);
my $query_parameter = join '%20',
map { "%2B$_%3A$query_params{$_}" }
keys %query_params;
my $url = "https//familysearch.org/search/collection/index#count=20&query=" .
$query_parameter . "&collection_id=2000219";
Один из способов сделать это:
file content:
link1
link2
...
linkn
use Data::Dumper;
use strict;
use warnings;
local $/=undef;
open(FILE,'<',$filename) or die $filename;
my $i = 1;
while (my $line = <FILE>){
chomp($line);
print "line: $line\n";
my $tempfile = './$i.html';$i++;
$mech->get( $line, ':content_file' => $tempfile, synchronize => 1 );
}