Строка Python заменить и перечислить с регулярным выражением

Я хочу реализовать преобразователь строк и перечислить (токенизатор) с помощью регулярных выражений.

если данные даны так:

"2017-04-03 08:10:42 сегодня новости... (несколько строк)... местоположение Китай оповещение (туман, 5), Нан, Нан, уровень (5), погода облачный трафик (сегодня> вчера) увеличение"

ожидаемый обработанный формат результата (список токенов):

['DATE', 'Plain', 'location', 'Alert', 'Nan', 'Level', 'WeatherCondition', 'TrafficCondition']

С помощью re.finditer(regex, given_data, re.I) Можно извлечь совпадающее регулярное выражение, но я хочу отобразить все как "Обычное", кроме соответствующего регулярного выражения.

Я также хочу удалить повторяющиеся значения из списка (например, "Обычный", "Нан").

0 ответов

Другие вопросы по тегам