Синтаксис RE2 для несоответствия нулю
У меня есть следующие значения (строки) в столбце user_id в bigQuery:
g_123_h_34_p_2
g_13_h_14_p_0
g_0_h_14_p_10
Я хочу получить результаты на основе функции REGEXP_CONTAINS в запросе (где предложение). BigQuery обеспечивает поддержку регулярных выражений с использованием библиотеки re2.
Я хочу получить результаты, где нет 0 между двумя '_'. Мой желаемый результат: g_123_h_34_p_2
Я не уверен, какое регулярное выражение я должен написать в функции REGEXP_CONTAINS. Я пытался следовать регулярному выражению, но у меня это не сработало:
REGEXP_CONTAINS (user_dim.user_id, r"^g_[^0][0-9]{1,10}_h_[^0]_p_[^0]$") = TRUE
REGEXP_CONTAINS (user_dim.user_id, r"^g_[1-9]*_h_[^0]*_p_[^0]*$") = TRUE
Ограничения регулярных выражений Регулярные выражения со следующими специальными символами не поддерживаются, так как они могут вызвать задержки: * (звездочка) + (знак плюс)
1 ответ
Попробуйте любой из ниже
REGEXP_CONTAINS(str, r'^0_|_0_|_0$')
REGEXP_CONTAINS(str, r'(^|_)0(_|$)')
например
#standardSQL
WITH t AS (
SELECT 'g_123_h_34_p_2' str UNION ALL
SELECT 'g_13_h_14_p_0' UNION ALL
SELECT 'g_0_h_14_p_10'
)
SELECT *
FROM t
WHERE NOT REGEXP_CONTAINS(str, r'(^|_)0(_|$)')
вернусь
Row str
1 g_123_h_34_p_2