Как соответствовать иностранным водам в BBEdit
Я искал способ найти и заменить иностранные слова в BBEdit, но у меня возникла проблема с этим. После исследования я наткнулся на Regex - что будет регулярным выражением для сопоставления иностранных символов? что привело меня к Regular-Expressions.info и текстовый блок указал:
Совпадение одной графемы, независимо от того, кодируется ли она как одна кодовая точка или как несколько кодовых точек с использованием комбинированных меток, легко в Perl, PCRE, PHP, Ruby 2.0 и приложениях Just Great Software: просто используйте \X.
и когда у меня есть слово (да, это сделано для тестирования) ōallaōallaēēalla
Я не могу использовать [A-Za-z]*
для всего слова вместо этого он работает в сегментах, и единственное решение, которое я смог придумать, это что-то вроде ([A-Za-z]*\X{1,10})
, Есть ли альтернативный подход, который не был бы слишком жадным и вытянул бы все слово вместо того, чтобы тянуть его по сегментам?
1 ответ
Вы могли бы использовать границу слова \b
чтобы соответствовать всему между границами. Это может не все, но для вашего надуманного примера это работает.
/\b(.+)\b/
Если вам также нужны слова в начале строки, вы должны включить их.
/(?:\b|^)(.+)\b/
Попробуйте это на regex101.com. Я не могу проверить, работает ли это в вашем BBEdit.