Parse::RecDescent - получение информации от него
Я работаю с парсером Parse:: RecDescent в Perl, и мне кажется, что у меня самое ужасное время для получения информации из него. Информация, легко доступная в Интернете, кажется, не имеет нетривиальных примеров.
Вот код:
event_function: object_list ':' event_list ';'
<defer:
{ #item is a special character with Parse::Recdescent.
print Dumper($item{object_list});
$return = $item[1];
}
>
| object_list ':' ';'
<defer:
{
print Dumper($item{object_list});
$return = $item[1];
}
>
Вот вывод
PS W:\developers\paulnathan\rd_dir> perl parser.pl testfile
$VAR1 = 4;
$VAR1 = 8;
PS W:\developers\paulnathan\rd_dir>
Входной файл анализируется правильно.
stuff, stuff2: pre-operation event = {foo1, foo2};
Он должен выводить хеш с ключом "stuff", "stuff2".
Мысли?
редактировать:
object_list :
object ',' object_list
<defer:
{
my $retval = ();
$retval = ::merge_hash_refs($item[1], $item[3]);
$return = $retval;
}
>
| object
<defer:
{
#print Dumper($item{object});
$return = $item{object};
}
>
object :
'/' /[a-z0-9_][a-z0-9_]*/ '/' '...'
<defer:
{
$::objects->{$item[2]} = "stuff";
$return = $::objects;
}
>
| /[a-z0-9_][a-z0-9_]*/
<defer:
{
$::objects->{$item[1]} = "stuff";
$return = $::objects;
}
>
edit2: Merge_hash_refs, на всякий случай.:-)
#takes two hash references.
sub merge_hash_refs {
my($ref1, $ref2) = @_;
my $retref = ();
while( my ($k, $v) = each %$ref1 ) {
$retref->{$k} = $v;
}
while( my ($k, $v) = each %$ref2 ) {
$retref->{$k} = $v;
}
return $retref;
}
2 ответа
Если вы добавите use strict
в вашем скрипте вы получите фатальную ошибку. Невозможно использовать строку ("1") в качестве ссылки HASH, в то время как "строгие ссылки" используются в [вызов merge_hash_refs
]. Похоже, что замыкания, созданные <defer>
директивы вызывают содержание @item
быть теми, когда производство совпало вместо хеш-референтов, в конечном итоге возвращаемых подчиненными. Удаление <defer>
директивы дает мне такой вывод:
$VAR1 = {
'stuff2' => 'stuff',
'stuff' => 'stuff'
};
Конечно, у этого есть побочный эффект, что $:: объект обновляется успешным object
производство, даже если правила более высокого уровня терпят неудачу (включая возврат). Я бы написал так:
use strict;
use warnings;
use Parse::RecDescent;
use Data::Dumper;
my $parser = Parse::RecDescent->new(<<'EOT');
event_function: object_list ':' event_list(?) ';'
{
$return = $item[1];
}
object_list : <leftop: object ',' object>
{
$return = { map { %$_ } @{$item[1]} };
}
object :
'/' /[a-z0-9_][a-z0-9_]*/ '/' '...'
{
$return = { $item[2] => 'stuff' };
}
| /[a-z0-9_][a-z0-9_]*/
{
$return = { $item[1] => 'stuff' };
}
# stub, don't know what this should be
event_list : /[^;]+/
EOT
my %object;
while (<DATA>) {
my $x = $parser->event_function($_);
next unless $x;
# merge objects into master list
while (my ($k, $v) = each %$x) {
$object{$k} = $v;
}
}
print Dumper \%object;
__DATA__
stuff, stuff2: pre-operation event = {foo1, foo2};
stuff3, stuff4: ;
Выход:
$VAR1 = {
'stuff2' => 'stuff',
'stuff3' => 'stuff',
'stuff' => 'stuff',
'stuff4' => 'stuff'
};
Возможно, это не ответ на ваш вопрос, но когда вы запускаете цикл each() через хеш, если каждый () ранее использовался в хэше, он просто начинается с того места, куда указывал итератор. Чтобы быть уверенным, поместите void-context keys() (например, keys(%$ref1);) перед циклом while для сброса итератора. В старых версиях Data::Dumper была небольшая ошибка: иногда итератор оставлял указатель сразу после последнего элемента, в результате чего хэш казался пустым для небезопасного цикла while (... each...):)