Сопоставить начало строки с re2c
Я использую re2c 0.10.5, и я не могу правильно сопоставить начало строки.
Например, я определил:
[aA] w "=" { return ATTRKEYWORD;}
[bB] w "=" { return BWKEYWORD;}
где w определяется как:
w = s*;
но если у меня есть строка
b=my string a=foobar
Я получу ATTRKEYWORD, когда не должен, так как он начинается с b=, я хотел бы получить BWKEYWORD.
Согласно http://re2c.org/manual.html, ^ не является началом новой строки.
Что значит
[^aA] w "=" { return ATTRKEYWORD;}
[^bB] w "=" { return BWKEYWORD;}
все еще не работает для моей проблемы.
Любое решение?
1 ответ
Это находит ключевое слово атрибута.
#include <stdio.h>
#include <string.h>
typedef struct lexerObj
{
char *mCursor;
char *mLimit;
char *mMarker;
char *mToken;
} lexerObj;
#define ATTRKEYWORD 1
#define BWKEYWORD 2
#define OTHERKEYWORD 3
int scanner(lexerObj *aLexer)
{
#define YYFILL(n) \
do { \
if (aLexer->mCursor >= aLexer->mLimit) { \
return 0; \
} \
} while (0);
/*!re2c
re2c:define:YYCTYPE = "char";
re2c:define:YYCURSOR = aLexer->mCursor;
re2c:define:YYLIMIT = aLexer->mLimit;
re2c:define:YYMARKER = aLexer->mMarker;
re2c:yyfill:enable = 1;
s = [ ];
w = s*;
*/
aLexer->mToken = aLexer->mCursor;
/*!re2c
[aA] w "=" { return ATTRKEYWORD;}
[bB] w "=" { return BWKEYWORD;}
. { return OTHERKEYWORD; }
*/
}
int main()
{
lexerObj aObj;
int a;
char sToken[512];
char *sBuffer = "b=my string a=foobar";
aObj.mCursor = sBuffer;
aObj.mLimit = aObj.mCursor + strlen(sBuffer);
while ( (a = scanner(&aObj)) != 0)
{
int len;
len = aObj.mCursor - aObj.mToken;
memset(sToken, 0, sizeof(sToken));
strncpy(sToken, aObj.mToken, len);
printf("Token = %d(%d) [%s]\n", a, len, sToken);
}
return 0;
}
Вот вывод.
Token = 2(2) [b=]
Token = 3(1) [m]
Token = 3(1) [y]
Token = 3(1) [ ]
Token = 3(1) [s]
Token = 3(1) [t]
Token = 3(1) [r]
Token = 3(1) [i]
Token = 3(1) [n]
Token = 3(1) [g]
Token = 3(1) [ ]
Token = 1(2) [a=]
Token = 3(1) [f]
Token = 3(1) [o]
Token = 3(1) [o]
Token = 3(1) [b]
Token = 3(1) [a]
Token = 3(1) [r]