Повышение духа lex записывает значение токена обратно во входной поток
Мне интересно, есть ли способ в boost::spirit::lex записать значение токена обратно во входной поток (возможно, после редактирования) и выполнить повторное сканирование. То, что я в основном ищу, - это функциональность, подобная unput() во Flex.
Спасибо!
2 ответа
Я реализовал свою собственную функцию unput() следующим образом:
struct unputImpl
{
template <typename Iter1T, typename Iter2T, typename StrT>
struct result {
typedef void type;
};
template <typename Iter1T, typename Iter2T, typename StrT>
typename result<Iter1T, Iter2T, StrT>::type operator()(Iter1T& start, Iter2T& end, StrT str) const {
start -= (str.length() - std::distance(start, end));
std::copy(str.begin(), str.end(), start);
end = start;
}
};
phoenix::function<unputImpl> const unput = unputImpl();
Это может быть использовано как:
this->self += lex::token_def<lex::omit>("{SYMBOL}\\(")
[
unput(_start, _end, "(" + construct<string>(_start, _end - 1) + " "),
_pass = lex::pass_flags::pass_ignore
];
Если длина необработанной строки больше, чем совпадающая длина токена, она переопределит некоторые из ранее проанализированных входных данных. Вам нужно позаботиться о том, чтобы в самом начале входной строки было достаточно свободного места для обработки случая, когда unput() вызывается для самого первого сопоставленного токена.
Похоже, вы просто хотите принимать токены в разных порядках, но с одинаковым значением.
Без дальнейших церемоний, вот полный пример, который показывает, как это будет сделано, выставляя идентификатор независимо от порядка ввода. Выход:
Input 'abc(' Parsed as: '(abc'
Input '(abc' Parsed as: '(abc'
Код
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/lex_lexertl.hpp>
#include <iostream>
#include <string>
using namespace boost::spirit;
///// LEXER
template <typename Lexer>
struct tokens : lex::lexer<Lexer>
{
tokens()
{
identifier = "[a-zA-Z][a-zA-Z0-9]*";
paren_open = '(';
this->self.add
(identifier)
(paren_open)
;
}
lex::token_def<std::string> identifier;
lex::token_def<lex::omit> paren_open;
};
///// GRAMMAR
template <typename Iterator>
struct grammar : qi::grammar<Iterator, std::string()>
{
template <typename TokenDef>
grammar(TokenDef const& tok) : grammar::base_type(ident_w_parenopen)
{
ident_w_parenopen =
(tok.identifier >> tok.paren_open)
| (tok.paren_open >> tok.identifier)
;
}
private:
qi::rule<Iterator, std::string()> ident_w_parenopen;
};
///// DEMONSTRATION
typedef std::string::const_iterator It;
template <typename T, typename G>
void DoTest(std::string const& input, T const& tokens, G const& g)
{
It first(input.begin()), last(input.end());
std::string parsed;
bool r = lex::tokenize_and_parse(first, last, tokens, g, parsed);
if (r) {
std::cout << "Input '" << input << "' Parsed as: '(" << parsed << "'\n";
}
else {
std::string rest(first, last);
std::cerr << "Parsing '" << input << "' failed\n" << "stopped at: \"" << rest << "\"\n";
}
}
int main(int argc, char* argv[])
{
typedef lex::lexertl::token<It, boost::mpl::vector<std::string> > token_type;
typedef lex::lexertl::lexer<token_type> lexer_type;
typedef tokens<lexer_type>::iterator_type iterator_type;
tokens<lexer_type> tokens;
grammar<iterator_type> g (tokens);
DoTest("abc(", tokens, g);
DoTest("(abc", tokens, g);
}