Строка Python заменить и перечислить с регулярным выражением
Я хочу реализовать преобразователь строк и перечислить (токенизатор) с помощью регулярных выражений.
если данные даны так:
"2017-04-03 08:10:42 сегодня новости... (несколько строк)... местоположение Китай оповещение (туман, 5), Нан, Нан, уровень (5), погода облачный трафик (сегодня> вчера) увеличение"
ожидаемый обработанный формат результата (список токенов):
['DATE', 'Plain', 'location', 'Alert', 'Nan', 'Level', 'WeatherCondition', 'TrafficCondition']
С помощью re.finditer(regex, given_data, re.I)
Можно извлечь совпадающее регулярное выражение, но я хочу отобразить все как "Обычное", кроме соответствующего регулярного выражения.
Я также хочу удалить повторяющиеся значения из списка (например, "Обычный", "Нан").