Лучший способ разобрать текстовый файл с вложенной информационной структурой

Question

Лучший способ разобрать текстовый файл с вложенной информационной структурой

Текстовый файл содержит сотни таких записей (формат выписки по счету MT940)

{1:F01AHHBCH110XXX0000000000}{2:I940X           N2}{3:{108:XBS/091502}}{4:
:20:XBS/091202/0001
:25:5887/507004-50
:28C:140/1
:60F:C0914CHF7789,
:61:0912021202D36,80NTRFNONREF//0887-1202-29-941
04392579-0 LUTHY + xxx, ZUR
:86:6034?60LUTHY + xxxx, ZUR vom 01.12.09 um 16:28 Karten-Nr. 2232
2579-0
:62F:C091202CHF52,2
:64:C091302CHF52,2
-}

Это должно войти в массив хэшей, как

[{"1"=>"F01AHHBCH110XXX0000000000"},
  "2"=>"I940X           N2", 
   3 => {108=>"XBS/091502"}
etc.
} ]

Я попробовал это с верхушкой дерева, но, похоже, это не правильный путь, потому что это больше для чего-то, на чем вы хотите делать расчеты, а мне просто нужна информация.

grammar Mt940

  rule document
    part1:string spaces [:|/] spaces part2:document 
    {
      def eval(env={})
        return part1.eval, part2.eval
      end
    }
    / string
    /  '{' spaces document spaces '}' spaces
    {
      def eval(env={})
        return [document.eval]
      end
    }
  end
end

Я тоже пробовал с регулярным выражением

matches = str.scan(/\A[{]?([0-9]+)[:]?([^}]*)[}]?\Z/i)

но это трудно с рекурсией...

Как я могу решить эту проблему?

2

regex ruby parsing treetop mt940

Источник

user140204 17 мар '10 в 01:11

1 ответ

Решение

Другие вопросы по тегам regex ruby parsing treetop mt940

user163203 17 мар '10 в 02:52 2010-03-17 02:52 · Accepted Answer · 2010-03-17 02:52

Существует несколько парсеров MT940 с открытым исходным кодом, доступных на Java и PHP. Вы можете посмотреть исходный код и перенести его на Ruby. Если вы используете JRuby, то вы можете использовать java-парсер в своем коде ruby.

Другой вариант - использовать драгоценный камень OFX. Драгоценный камень анализирует файлы OFX. Поскольку ваш файл в формате MT940, вы должны конвертировать файл в формат OFX, используя один из доступных бесплатных конвертеров. Этот подход практичен, если вы импортируете пакетное задание и т. Д.

Ссылка

MT940 Java-парсер.

Конвертер MT940 в OFX 1

Конвертер MT940 в OFX 2