Сопоставить начало строки с re2c

Я использую re2c 0.10.5, и я не могу правильно сопоставить начало строки.

Например, я определил:

[aA] w "="      { return ATTRKEYWORD;}
[bB] w "="      { return BWKEYWORD;}

где w определяется как:

w               =       s*;

но если у меня есть строка

b=my string a=foobar

Я получу ATTRKEYWORD, когда не должен, так как он начинается с b=, я хотел бы получить BWKEYWORD.

Согласно http://re2c.org/manual.html, ^ не является началом новой строки.

Что значит

[^aA] w "="      { return ATTRKEYWORD;}
[^bB] w "="      { return BWKEYWORD;}

все еще не работает для моей проблемы.

Любое решение?

1 ответ

Это находит ключевое слово атрибута.

#include <stdio.h>
#include <string.h>

typedef struct lexerObj
{
    char *mCursor;
    char *mLimit;
    char *mMarker;
    char *mToken;

} lexerObj;

 #define ATTRKEYWORD  1
 #define BWKEYWORD    2
 #define OTHERKEYWORD 3

int scanner(lexerObj *aLexer)
{
#define YYFILL(n)                                \
    do {                                         \
        if (aLexer->mCursor >= aLexer->mLimit) { \
            return 0;                            \
        }                                        \
    } while (0);

    /*!re2c
      re2c:define:YYCTYPE     = "char";
      re2c:define:YYCURSOR    = aLexer->mCursor;
      re2c:define:YYLIMIT     = aLexer->mLimit;
      re2c:define:YYMARKER    = aLexer->mMarker;
      re2c:yyfill:enable      = 1;

      s = [ ];
      w = s*;
    */

    aLexer->mToken = aLexer->mCursor;

    /*!re2c
      [aA] w "=" { return ATTRKEYWORD;}
      [bB] w "=" { return BWKEYWORD;}
      .          { return OTHERKEYWORD;  }
    */
}


int main()
{
    lexerObj aObj;
    int a;
    char sToken[512];
    char *sBuffer = "b=my string a=foobar";

    aObj.mCursor = sBuffer;
    aObj.mLimit  = aObj.mCursor + strlen(sBuffer);

    while ( (a = scanner(&aObj)) != 0)
    {
        int len;

        len = aObj.mCursor - aObj.mToken;

        memset(sToken, 0, sizeof(sToken));
        strncpy(sToken, aObj.mToken, len);
        printf("Token = %d(%d) [%s]\n", a, len, sToken);
    }

    return 0;
}

Вот вывод.

Token = 2(2) [b=]
Token = 3(1) [m]
Token = 3(1) [y]
Token = 3(1) [ ]
Token = 3(1) [s]
Token = 3(1) [t]
Token = 3(1) [r]
Token = 3(1) [i]
Token = 3(1) [n]
Token = 3(1) [g]
Token = 3(1) [ ]
Token = 1(2) [a=]
Token = 3(1) [f]
Token = 3(1) [o]
Token = 3(1) [o]
Token = 3(1) [b]
Token = 3(1) [a]
Token = 3(1) [r]
Другие вопросы по тегам