Многоязычное сопоставление Python (создание классов эквивалентности)

У меня есть проект преобразования одной базы данных в другую. Один из исходных столбцов базы данных определяет категорию строки. Этот столбец должен быть сопоставлен с новой категорией в новой базе данных.

Например, предположим, что исходные категории:parrot, spam, cheese_shop, Cleese, Gilliam, Palin

Теперь это немного многословно для меня, и я хочу, чтобы эти строки были классифицированы как sketch, actor То есть определите все эскизы и всех актеров как два класса эквивалентности.

>>> monty={'parrot':'sketch', 'spam':'sketch', 'cheese_shop':'sketch', 
'Cleese':'actor', 'Gilliam':'actor', 'Palin':'actor'}
>>> monty
{'Gilliam': 'actor', 'Cleese': 'actor', 'parrot': 'sketch', 'spam': 'sketch', 
'Palin': 'actor', 'cheese_shop': 'sketch'}

Это довольно неловко - я бы предпочел иметь что-то вроде:

monty={ ('parrot','spam','cheese_shop'): 'sketch', 
        ('Cleese', 'Gilliam', 'Palin') : 'actors'}

Но это, конечно, устанавливает весь кортеж в качестве ключа:

>>> monty['parrot']

Traceback (most recent call last):
  File "<pyshell#29>", line 1, in <module>
    monty['parrot']
KeyError: 'parrot'

Любые идеи, как создать элегантный словарь многие-к-одному в Python?

Спасибо,

Адам

4 ответа

Решение

Мне кажется, у вас есть две проблемы. Во-первых, как вы выражаете свое отображение изначально, то есть, как вы вводите отображение в свой файл new_mapping.py. Во-вторых, как работает отображение в процессе переопределения. Нет причин для того, чтобы эти два представления были одинаковыми.

Начните с сопоставления, которое вам нравится:

monty = { 
    ('parrot','spam','cheese_shop'): 'sketch', 
    ('Cleese', 'Gilliam', 'Palin') : 'actors',
}

затем преобразуйте его в нужное вам отображение:

working_monty = {}
for k, v in monty.items():
    for key in k:
        working_monty[key] = v

производство:

{'Gilliam': 'actors', 'Cleese': 'actors', 'parrot': 'sketch', 'spam': 'sketch', 'Palin': 'actors', 'cheese_shop': 'sketch'}

затем используйте working_monty делать работу.

Вы можете переопределить индексатор dict, но, возможно, будет лучше следующее простое решение:

>>> assoc_list = ( (('parrot','spam','cheese_shop'), 'sketch'), (('Cleese', 'Gilliam', 'Palin'), 'actors') )
>>> equiv_dict = dict()
>>> for keys, value in assoc_list:
    for key in keys:
        equiv_dict[key] = value


>>> equiv_dict['parrot']
'sketch'
>>> equiv_dict['spam']
'sketch'

(Возможно, вложенный цикл for может быть сжат впечатляющим однострочником, но это работает и читается.)

>>> monty={ ('parrot','spam','cheese_shop'): 'sketch', 
        ('Cleese', 'Gilliam', 'Palin') : 'actors'}

>>> item=lambda x:[z for y,z in monty.items() if x in y][0]
>>>
>>> item("parrot")
'sketch'
>>> item("Cleese")
'actors'

Но позвольте мне сказать вам, это будет медленнее, чем обычно, один в один словарь.

Если вы хотите, чтобы несколько ключей указывали на одно и то же значение, т.е.

m_dictionary{('k1', 'k2', 'k3', 'k4'):1, ('k5', 'k6'):2} и получить к ним доступ как,

`print(m_dictionary['k1'])` ==> `1`.

Проверьте этот много словарный модуль Python multi_key_dict, Установите и импортируйте его. https://pypi.python.org/pypi/multi_key_dict

Другие вопросы по тегам