Регулярное выражение, чтобы показывать только те элементы, которые начинаются со слов в заглавных буквах

Я ищу строку регулярного выражения (для использования в GA), которая идентифицирует записи, которые начинаются со слов в полных заглавных буквах.

Например, чтобы включить:

  • IBUPROFEN: Британский национальный формуляр
  • ЦЕТИРИЗИН ГИДРОХЛОРИД: Британский национальный формуляр

но исключить:

  • Antimuscarinics: Британский национальный формуляр

Я пытался использовать: ^[AZ]{5,25}

Есть идеи?

1 ответ

Чтобы сопоставить строку, начинающуюся со слова в верхнем регистре, используйте:

^[A-Z]+\b.*

Если вы хотите исключить определенные заглавные слова в начале строки, например, TOM а также JERRYизмените его на:

^(?!(?:TOM|JERRY)\b)[A-Z]+\b.*

объяснение

  • ^ якорь утверждает, что мы находимся в начале строки
  • [A-Z]+ соответствует заглавным буквам
  • \b является границей слова, которая соответствует позиции, где одна сторона является буквой, а другая сторона не является буквой (например, пробел или начало строки)
  • .* сопоставляет любые символы до конца строки

Для второго (?!(?:TOM|JERRY)\b) является негативным взглядом, который утверждает, что то, что следует, не TOM или же JERRY, сопровождаемый границей.

Другие вопросы по тегам