Мне нужно регулярное выражение, чтобы соответствовать фактам марионеточного фактора
Кукольные факты выглядят так:
processors => {"models"=>["AMD Opteron(tm) Processor 6172", "AMD Opteron(tm) Processor 6172", "AMD Opteron(tm) Processor 6172", "AMD Opteron(tm) Processor 6172"], "count"=>4, "physicalcount"=>2}
productname => VMware Virtual Platform
ps => ps -ef
puppetversion => 3.6.2
rubysitedir => /usr/local/brs/harmony-puppet/lib/ruby/site_ruby/2.1.0
rubyversion => 2.1.2
sshecdsakey => AAAAE2VjZHNhLXNoYTItbmlzdHAyNTYAAAAIbmlzdHAyNTYAAABBBNDUmg8FQGCO/r/VGABUPwBqT8zTwzXwZCjTdBC6cXj1Mo5ypxuqO1Qtwg9uQagcS5eLNbv+SxHotpzYSXZ1R8g=
sshfp_dsa => SSHFP 2 1 42ffbd293f1501c0718b2b7b3852542329da1758
SSHFP 2 2 eb52d78a34bdadecc41b38366a5580c923bbb6cd0b81cec76de6379ce4251439
sshfp_ecdsa => SSHFP 3 1 d41abd2e3aff846b4efb59dbc8e4803875d33130
SSHFP 3 2 ae77a20a66859976e06efb7d6dd0819db4f9e9d93bc55da52a4bffff6acb1baa
sshfp_rsa => SSHFP 1 1 d3f14587683138e6d10cacba92fa34364ed5d326
SSHFP 1 2 132856925e056d02767e6c6ca4015ed21ac4c6eddb727f7c69e5edecb8806884
sshrsakey => AAAAB3NzaC1yc2EAAAADAQABAAABAQDzcJ6158aIkY161vcDH6WKNgKAeUsxrHh+HJH9IEistcV2TUJSdHtG/p5peI+cTa0EhabbNw8ToUU3ZWYmiTmxxuZzxggAxCx6xhWNDgC/492QnouxHnqjxwpFyIYnLpdbaMRV/6t9iE7v09Gfb31TS3/DbAUh5yla1OOeHbxJQ/eUOUYgy7/6eFL43+R9SfiuP11VRK8r325mCOFaPqw8VuNeGul/rMnccBCbuFvgmQnfOo/ldwrfOL2W4qAvfE0bKyG13WrDSlauo+CFtYqDK08hCItjrbVKgVrOzLCuKGzKFuqOgF3u8Q1je23qu7eUmF7lZPYVWSEpkh0xlR0p
swapfree => 1.45 GB
swapfree_mb => 1482.82
swapsize => 1.46 GB
swapsize_mb => 1497.00
system_uptime => {"seconds"=>6034301, "hours"=>1676, "days"=>69, "uptime"=>"69 days"}
timezone => PDT
Я пытаюсь легко разделить каждый факт на пару ключ / значение. Используя этот сайт:
И это регулярное выражение
(?m)^(\S+) => (((?!^\S+ => ).)*)$
Я могу получить то, что хочу (все ключи и значения совпадают идеально). Проблема в том, что я пишу свой код на Java и использую этот сайт:
http://java-regex-tester.appspot.com/
С теми же данными я не получаю совпадения, которые хочу. В частности, факты, где значение пары ключ / значение содержит символ новой строки, такой как этот:
sshfp_rsa => SSHFP 1 1 d3f14587683138e6d10cacba92fa34364ed5d326
SSHFP 1 2 132856925e056d02767e6c6ca4015ed21ac4c6eddb727f7c69e5edecb8806884
В итоге опускаем вторую строку значения:
key = sshfp_rsa
value = SSHFP 1 1 d3f14587683138e6d10cacba92fa34364ed5d326
Может ли кто-нибудь помочь мне построить правильное регулярное выражение?
2 ответа
Это регулярное выражение должно работать для вас:
(?ms)^(\w+) => (.*?)(?=(?:\s^\w+ =>|\z))
В коде Java:
Pattern p = Pattern.compile("^(\\w+) => (.*?)(?=(?:\\s^\\w+ =>|\\z))",
Pattern.MULTILINE | Pattern.DOTALL);
RegEx Demo
Используйте это выражение:
(?ms)^(\S+) => (.*?(?=^\S+ => |\Z))
Я сохранил большую часть той же логики, за исключением поиска значения... давайте разберем это:
.*? (?# lazily match 0+ characters)
(?= (?# begin lookahead to end value)
^\S+ => (?# find the start of a new key)
| (?# OR)
\Z (?# end of the string)
) (?# end lookahead)
Мы используем модификатор dot-match-newline (s
) и сделайте ленивое состязание, которое заканчивается заглядыванием. Lookahead - это либо новый ключ, либо конец строки.