Как соответствовать иностранным водам в BBEdit

Я искал способ найти и заменить иностранные слова в BBEdit, но у меня возникла проблема с этим. После исследования я наткнулся на Regex - что будет регулярным выражением для сопоставления иностранных символов? что привело меня к Regular-Expressions.info и текстовый блок указал:

Совпадение одной графемы, независимо от того, кодируется ли она как одна кодовая точка или как несколько кодовых точек с использованием комбинированных меток, легко в Perl, PCRE, PHP, Ruby 2.0 и приложениях Just Great Software: просто используйте \X.

и когда у меня есть слово (да, это сделано для тестирования) ōallaōallaēēalla Я не могу использовать [A-Za-z]* для всего слова вместо этого он работает в сегментах, и единственное решение, которое я смог придумать, это что-то вроде ([A-Za-z]*\X{1,10}), Есть ли альтернативный подход, который не был бы слишком жадным и вытянул бы все слово вместо того, чтобы тянуть его по сегментам?

1 ответ

Вы могли бы использовать границу слова \b чтобы соответствовать всему между границами. Это может не все, но для вашего надуманного примера это работает.

/\b(.+)\b/

Если вам также нужны слова в начале строки, вы должны включить их.

/(?:\b|^)(.+)\b/

Попробуйте это на regex101.com. Я не могу проверить, работает ли это в вашем BBEdit.

Другие вопросы по тегам