Многоязычное сопоставление Python (создание классов эквивалентности)
У меня есть проект преобразования одной базы данных в другую. Один из исходных столбцов базы данных определяет категорию строки. Этот столбец должен быть сопоставлен с новой категорией в новой базе данных.
Например, предположим, что исходные категории:parrot, spam, cheese_shop, Cleese, Gilliam, Palin
Теперь это немного многословно для меня, и я хочу, чтобы эти строки были классифицированы как sketch, actor
То есть определите все эскизы и всех актеров как два класса эквивалентности.
>>> monty={'parrot':'sketch', 'spam':'sketch', 'cheese_shop':'sketch',
'Cleese':'actor', 'Gilliam':'actor', 'Palin':'actor'}
>>> monty
{'Gilliam': 'actor', 'Cleese': 'actor', 'parrot': 'sketch', 'spam': 'sketch',
'Palin': 'actor', 'cheese_shop': 'sketch'}
Это довольно неловко - я бы предпочел иметь что-то вроде:
monty={ ('parrot','spam','cheese_shop'): 'sketch',
('Cleese', 'Gilliam', 'Palin') : 'actors'}
Но это, конечно, устанавливает весь кортеж в качестве ключа:
>>> monty['parrot']
Traceback (most recent call last):
File "<pyshell#29>", line 1, in <module>
monty['parrot']
KeyError: 'parrot'
Любые идеи, как создать элегантный словарь многие-к-одному в Python?
Спасибо,
Адам
4 ответа
Мне кажется, у вас есть две проблемы. Во-первых, как вы выражаете свое отображение изначально, то есть, как вы вводите отображение в свой файл new_mapping.py. Во-вторых, как работает отображение в процессе переопределения. Нет причин для того, чтобы эти два представления были одинаковыми.
Начните с сопоставления, которое вам нравится:
monty = {
('parrot','spam','cheese_shop'): 'sketch',
('Cleese', 'Gilliam', 'Palin') : 'actors',
}
затем преобразуйте его в нужное вам отображение:
working_monty = {}
for k, v in monty.items():
for key in k:
working_monty[key] = v
производство:
{'Gilliam': 'actors', 'Cleese': 'actors', 'parrot': 'sketch', 'spam': 'sketch', 'Palin': 'actors', 'cheese_shop': 'sketch'}
затем используйте working_monty
делать работу.
Вы можете переопределить индексатор dict, но, возможно, будет лучше следующее простое решение:
>>> assoc_list = ( (('parrot','spam','cheese_shop'), 'sketch'), (('Cleese', 'Gilliam', 'Palin'), 'actors') )
>>> equiv_dict = dict()
>>> for keys, value in assoc_list:
for key in keys:
equiv_dict[key] = value
>>> equiv_dict['parrot']
'sketch'
>>> equiv_dict['spam']
'sketch'
(Возможно, вложенный цикл for может быть сжат впечатляющим однострочником, но это работает и читается.)
>>> monty={ ('parrot','spam','cheese_shop'): 'sketch',
('Cleese', 'Gilliam', 'Palin') : 'actors'}
>>> item=lambda x:[z for y,z in monty.items() if x in y][0]
>>>
>>> item("parrot")
'sketch'
>>> item("Cleese")
'actors'
Но позвольте мне сказать вам, это будет медленнее, чем обычно, один в один словарь.
Если вы хотите, чтобы несколько ключей указывали на одно и то же значение, т.е.
m_dictionary{('k1', 'k2', 'k3', 'k4'):1, ('k5', 'k6'):2}
и получить к ним доступ как,
`print(m_dictionary['k1'])` ==> `1`.
Проверьте этот много словарный модуль Python multi_key_dict
, Установите и импортируйте его. https://pypi.python.org/pypi/multi_key_dict