Приоритет оператора в мегапарсек

Question

Приоритет оператора в мегапарсек

У меня проблемы с использованием Megaparsec 6 makeExprParser помощник. Я не могу понять, как связать оба бинарных ^ и одинарный - на уровнях предшествования я бы ожидал.

Используя это makeExprParser синтаксический анализатор выражений:

expressionParser :: Parser Expression
expressionParser =
    makeExprParser termParser
      [
        [InfixR $ BinOp BinaryExp <$ symbol "^"],
        [
          Prefix $ MonOp MonoMinus <$ symbol "-",
          Prefix $ MonOp MonoPlus <$ symbol "+"
        ],
        [
          InfixL $ BinOp BinaryMult <$ symbol "*",
          InfixL $ BinOp BinaryDiv <$ symbol "/"
        ],
        [
          InfixL $ BinOp BinaryPlus <$ symbol "+",
          InfixL $ BinOp BinaryMinus <$ symbol "-"
        ]
      ]

Я ожидаю, что эти тесты пройдут:

testEqual expressionParser "1^2" "(1)^(2)"
testEqual expressionParser "-1^2" "-(1^2)"
testEqual expressionParser "1^-2" "1^(-2)"
testEqual expressionParser "-1^-2" "-(1^(-2))"

То есть, -1^-2 должен анализировать как то же самое, что и -(1^(-2)), Вот как, например, Python анализирует его:

>>> 2**-2
0.25
>>> -2**-2
-0.25
>>> -2**2
-4

и Руби:

irb(main):004:0> 2**-2
=> (1/4)
irb(main):005:0> -2**-2
=> (-1/4)
irb(main):006:0> -2**2
=> -4

Но этот парсер Megaparsec вместо этого не может разобрать 1^-2 вообще вместо того, чтобы дать мне полезную ошибку:

(TrivialError (SourcePos {sourceName = \"test.txt\", sourceLine = Pos 1, sourceColumn = Pos 3} :| []) (Just (Tokens ('-' :| \"\"))) (fromList [Tokens ('(' :| \"\"),Label ('i' :| \"nteger\")]))")

который я прочитал, чтобы сказать: "Я мог взять любого из этих персонажей здесь, но это - меня сбило с толку ".

Если я отрегулирую некоторые из приоритетов таблицы операторов, как это (перемещение экспоненты после унарного -):

expressionParser =
    makeExprParser termParser
      [
        [
          Prefix $ MonOp MonoMinus <$ symbol "-",
          Prefix $ MonOp MonoPlus <$ symbol "+"
        ],
        [InfixR $ BinOp BinaryExp <$ symbol "^"],
        [
          InfixL $ BinOp BinaryMult <$ symbol "*",
          InfixL $ BinOp BinaryDiv <$ symbol "/"
        ],
        [
          InfixL $ BinOp BinaryPlus <$ symbol "+",
          InfixL $ BinOp BinaryMinus <$ symbol "-"
        ]
      ]

тогда я больше не получаю ошибку разбора, но -1^2 неправильно разбирает как (-1)^2 (вместо правильного -(1^2)).

Вот полный автономный парсер, чтобы показать проблему (для этого требуется HUnit и, конечно, мегапарсек):

module Hascas.Minimal where

import Data.Void (Void)
import Test.HUnit hiding (test)
import Text.Megaparsec hiding (ParseError)
import Text.Megaparsec.Char
import Text.Megaparsec.Expr
import qualified Text.Megaparsec as MP
import qualified Text.Megaparsec.Char.Lexer as L

data Expression
    = Literal Integer
    | MonOp MonoOperator Expression
    | BinOp BinaryOperator Expression Expression
  deriving (Read, Show, Eq, Ord)

data BinaryOperator
    = BinaryPlus
    | BinaryMinus
    | BinaryDiv
    | BinaryMult
    | BinaryExp
  deriving (Read, Show, Eq, Ord)

data MonoOperator
    = MonoPlus
    | MonoMinus
  deriving (Read, Show, Eq, Ord)

type Parser a = Parsec Void String a
type ParseError = MP.ParseError (Token String) Void

spaceConsumer :: Parser ()
spaceConsumer = L.space space1 lineComment blockComment
  where
    lineComment  = L.skipLineComment "//"
    blockComment = L.skipBlockComment "/*" "*/"

lexeme :: Parser a -> Parser a
lexeme = L.lexeme spaceConsumer

symbol :: String -> Parser String
symbol = L.symbol spaceConsumer

expressionParser :: Parser Expression
expressionParser =
    makeExprParser termParser
      [
        [InfixR $ BinOp BinaryExp <$ symbol "^"],
        [
          Prefix $ MonOp MonoMinus <$ symbol "-",
          Prefix $ MonOp MonoPlus <$ symbol "+"
        ],
        [
          InfixL $ BinOp BinaryMult <$ symbol "*",
          InfixL $ BinOp BinaryDiv <$ symbol "/"
        ],
        [
          InfixL $ BinOp BinaryPlus <$ symbol "+",
          InfixL $ BinOp BinaryMinus <$ symbol "-"
        ]
      ]

termParser :: Parser Expression
termParser = (
        (try $ Literal <$> L.decimal)
    <|> (try $ parens expressionParser))

parens :: Parser a -> Parser a
parens x = between (symbol "(") (symbol ")") x

main :: IO ()
main = do
    -- just to show that it does work in the + case:
    test expressionParser "1+(-2)" $
      BinOp BinaryPlus (Literal 1) (MonOp MonoMinus $ Literal 2)
    test expressionParser "1+-2" $
      BinOp BinaryPlus (Literal 1 ) (MonOp MonoMinus $ Literal 2)

    -- but not in the ^ case
    test expressionParser "1^-2" $
      BinOp BinaryExp (Literal 1) (MonOp MonoMinus $ Literal 2)
    test expressionParser "-1^2" $
      MonOp MonoMinus $ BinOp BinaryExp (Literal 1) (Literal 2)
    test expressionParser "-1^-2" $
      MonOp MonoMinus $ BinOp BinaryExp (Literal 1) (MonOp MonoMinus $ Literal 2)

    -- exponent precedence is weird
    testEqual expressionParser "1^2" "(1)^(2)"
    testEqual expressionParser "-1^2" "-(1^2)"
    testEqual expressionParser "1^-2" "1^(-2)"
    testEqual expressionParser "-1^-2" "-(1^(-2))"
    testEqual expressionParser "1^2^3^4" "1^(2^(3^(4))))"
  where
    test :: (Eq a, Show a) => Parser a -> String -> a -> IO ()
    test parser input expected = do
      assertEqual input (Right expected) $ parse (spaceConsumer >> parser <* eof) "test.txt" input

    testEqual :: (Eq a, Show a) => Parser a -> String -> String -> IO ()
    testEqual parser input expected = do
        assertEqual input (p expected) (p input)
      where
        p i = parse (spaceConsumer >> parser <* eof) "test.txt" i

Можно ли заставить Megaparsec анализировать эти операторы на уровнях приоритета, которые делают другие языки?

3

haskell megaparsec

Источник

user1865521 31 авг '18 в 01:57

1 ответ

Другие вопросы по тегам haskell megaparsec

user149392 31 авг '18 в 12:06 2018-08-31 12:06 · Answer 1 · 2018-08-31 12:06

makeExprParser termParser [precN, ..., prec1] создаст анализатор восхождения по приоритету, который работает таким образом, что каждый уровень приоритета вызывает следующий более высокий уровень приоритета. Так что, если вы определите его вручную, у вас будет правило для инфикса + а также -, который использует правило mult-and-div в качестве операндов. Это, в свою очередь, будет использовать правило префикса в качестве операндов, и это будет использовать ^ править как операнд. Наконец то ^ Правило использует termParser для операндов.

Здесь важно отметить, что ^ Правило (или в более общем смысле: любое правило с более высоким приоритетом, чем префиксные операторы) вызывает синтаксический анализатор, который не принимает префиксные операторы в начале. Таким образом, префиксные операторы не могут появляться справа от таких операторов (кроме внутри скобок).

В основном это означает, что ваш вариант использования не поддерживается makeExprParser,

Чтобы обойти это, вы можете использовать makeExprParser обрабатывать только инфиксные операторы с более низким приоритетом, чем префиксные операторы, а затем обрабатывать префиксные операторы и ^ вручную, так что правильный операнд ^ будет "возвращаться" к префиксным операторам. Что-то вроде этого:

expressionParser =
    makeExprParser prefixParser
      [
        [
          InfixL $ BinOp BinaryMult <$ symbol "*",
          InfixL $ BinOp BinaryDiv <$ symbol "/"
        ],
        [
          InfixL $ BinOp BinaryPlus <$ symbol "+",
          InfixL $ BinOp BinaryMinus <$ symbol "-"
        ]
      ]

prefixParser =
  do
    prefixOps <- many prefixOp
    exp <- exponentiationParser
    return $ foldr ($) exp prefixOps
  where
    prefixOp = MonOp MonoMinus <$ symbol "-" <|> MonOp MonoPlus <$ symbol "+"

exponentiationParser =
  do
    lhs <- termParser
    -- Loop back up to prefix instead of going down to term
    rhs <- optional (symbol "^" >> prefixParser)
    return $ maybe lhs (BinOp BinaryExp lhs) rhs

Обратите внимание, что в отличие от makeExprParserэто также позволяет использовать несколько последовательных префиксных операторов (например, --x за двойное отрицание). Если вы этого не хотите, замените many с optional в определении prefixParser,