В поисках лучшего алгоритма или структуры данных для улучшения преобразования подключения от идентификаторов к индексам
Я работаю с Python 3.6.2 и NumPy.
Я пишу код для визуализации модели конечных элементов и результатов.
Код визуализации требует, чтобы узлы и элементы сетки конечных элементов идентифицировались с помощью индексов (начиная с нуля, без пробелов), но входные модели основаны на идентификаторах и могут иметь очень большие промежутки в пространстве идентификаторов.
Поэтому я обрабатываю все узлы и элементы и изменяю их, чтобы использовать индексы вместо идентификаторов.
Узлы
Первым шагом является обработка массива узлов и координат узлов. Это приходит ко мне отсортированным, поэтому мне не нужно ничего делать с координатами - я просто использую индексы массива узловых координат. Но мне нужно переопределить связность элементов, чтобы они были индексными, а не ID.
Для этого я создаю словарь, перебирая массив идентификаторов узлов и добавляя каждый узел в словарь, используя его идентификатор в качестве ключа и его индекс в качестве значения.
В следующем фрагменте кода
model.nodes - это словарь, содержащий все объекты Node, идентифицированные по их идентификатору
nodeCoords - это предварительно выделенный массив NumPy, в котором я храню узловые координаты для последующего использования в визуализации. Именно индексы этого массива я должен использовать позже, чтобы переопределить мои элементы
nodeIdIndexMap - это словарь, который я заполняю, используя идентификатор узла в качестве ключа и индекс nodeCoords в качестве значения
Код:
nodeindex=0
node_id_index_map={}
for nid, node in sorted(model.nodes.items()):
nodeCoords[nodeIndex] = node.xyz
nodeIdIndexMap[nid] = nodeIndex
nodeIndex+=1
Затем я перебираю все элементы, просматривая идентификатор каждого элемента элемента в словаре, получая индекс и заменяя идентификатор на индекс.
В следующем фрагменте кода
- tet4Elements - это словарь, содержащий все элементы типа tet4, которые вводятся с использованием идентификатора элемента
- n1, n2, n3 и n4 - это заранее выделенные массивы, которые содержат узлы элементов
- element.nodes[n].nid получает идентификатор узла элемента
- n1[tet4Index] = nodeIdIndexMap[element.nodes[0].nid ищет идентификатор узла элемента в словаре, созданном в предыдущем фрагменте, возвращает соответствующий индекс и сохраняет его в массиве numpy.
Код:
tet4Index = 0
for eid, element in tet4Elements.items():
id[tet4Index] = eid
n1[tet4Index] = nodeIdIndexMap[element.nodes[0].nid]
n2[tet4Index] = nodeIdIndexMap[element.nodes[1].nid]
n3[tet4Index] = nodeIdIndexMap[element.nodes[2].nid]
n4[tet4Index] = nodeIdIndexMap[element.nodes[3].nid]
tet4Index+=1
Вышеописанное работает, но это медленно... Обработка 6 500000 элементов tet4 занимает около 16 секунд (каждый элемент tet4 имеет четыре узла, каждый идентификатор узла должен быть найден в словаре, так что это 26 миллионов поисков в словаре в словарь с 1 600000 записей.
Так что вопрос в том, как сделать это быстрее? В какой-то момент я перейду на C++, но сейчас я пытаюсь улучшить производительность в Python.
Буду благодарен за любые идеи по улучшению производительности.
Спасибо,
Doug
1 ответ
С цифрами, которые вы цитируете, и разумным аппаратным обеспечением (8 ГБ оперативной памяти) сопоставление может быть выполнено менее чем за секунду Плохая новость заключается в том, что извлечение данных из исходных указаний объектов занимает в 60 раз больше, как минимум, с созданными мною объектами.
# extract 29.2821946144104 map 0.4702422618865967
Но, может быть, вы можете найти какой-то способ массовых запросов ваших узлов и tets?
Код:
import numpy as np
from time import time
def mock_data(nn, nt, idf):
nid = np.cumsum(np.random.randint(1, 2*idf, (nn,)))
nodes = np.random.random((nn, 3))
import collections
node = collections.namedtuple('node', 'nid xyz')
tet4 = collections.namedtuple('tet4', 'nodes')
nodes = dict(zip(nid, map(node, nid, nodes)))
eid = np.cumsum(np.random.randint(1, 2*idf, (nt,)))
tet4s = nid[np.random.randint(0, nn, (nt, 4))]
tet4s = dict(zip(eid, map(tet4, map(lambda t: [nodes[ti] for ti in t], tet4s))))
return nodes, tet4s
def f_extract(nodes, tet4s, limit=15*10**7):
nid = np.array(list(nodes.keys()))
from operator import attrgetter
ncoords = np.array(list(map(attrgetter('xyz'), nodes.values())))
tid = np.array(list(tet4s.keys()))
tnodes = np.array([[n.nid for n in v.nodes] for v in tet4s.values()])
return nid, ncoords, tid, tnodes, limit
def f_lookup(nid, ncoords, tid, tnodes, limit):
nmx = nid.max()
if nmx < limit:
nlookup = np.empty((nmx+1,), dtype=np.uint32)
nlookup[nid] = np.arange(len(nid), dtype=np.uint32)
tnodes = nlookup[tnodes]
del nlookup
else:
nidx = np.argsort(nid)
nid = nid[nidx]
ncoords = ncoords[nidx]
tnodes = nid.searchsorted(tnodes)
tmx = tid.max()
if tmx < limit:
tlookup = np.empty((tmx+1,), dtype=np.uint32)
tlookup[tid] = np.arange(len(tid), dtype=np.uint32)
else:
tidx = np.argsort(tid)
tid = tid[tidx]
tnodes = tnodes[tidx]
return nid, ncoords, tid, tnodes
data = mock_data(1_600_000, 6_500_000, 16)
t0 = time()
data = f_extract(*data)
t1 = time()
f_lookup(*data)
t2 = time()
print('extract', t1-t0, 'map', t2-t1)