Matlab медленная производительность с использованием замыканий
Я кодирую решение для уравнения Пуассона на двумерном прямоугольнике, используя конечные элементы. Чтобы упростить код, я сохраняю дескрипторы базовых функций в массиве, а затем зацикливаю эти базовые функции для создания моей матрицы и правой части. Проблема в том, что даже для очень грубых сеток это слишком медленно. Для сетки 9x9 (с использованием Dirichlet BC, для решения которой нужно 49 узлов) это занимает около 20 секунд. Используя профиль, я заметил, что около половины времени тратится на доступ (а не на выполнение) моих базовых функций.
Профилировщик говорит matrix_assembly>@(x,y)bilinearBasisFunction(x,y,xc(k-1),xc(k),xc(k+1),yc(j-1),yc(j),yc(j+1)) (156800 calls, 11.558 sec)
собственное время (без выполнения билинейного базового кода) превышает 9 секунд. Есть идеи, почему это может быть так медленно?
Вот часть кода, я могу опубликовать больше, если это необходимо:
%% setting up the basis functions, storing them in cell array
basisFunctions = cell(nu, 1); %nu is #unknowns
i = 1;
for j = 2:length(yc) - 1
for k = 2:length(xc) - 1
basisFunctions{i} = @(x,y) bilinearBasisFunction(x,y, xc(k-1), xc(k),...
xc(k+1), yc(j-1), yc(j), yc(j+1)); %my code for bilinear basis functions
i = i+1;
end
end
%% Assemble matrices and RHS
M = zeros(nu,nu);
S = zeros(nu,nu);
F = zeros(nu, 1);
for iE = 1:ne
for iBF = 1:nu
[z1, dx1, dy1] = basisFunctions{iBF}(qx(iE), qy(iE));
F(iBF) = F(iBF) + z1*forcing_handle(qx(iE),qy(iE))/ae(iE);
for jBF = 1:nu
[z2, dx2, dy2] = basisFunctions{jBF}(qx(iE), qy(iE));
%M(iBF,jBF) = M(iBF,jBF) + z1*z2/ae(iE);
S(iBF,jBF) = S(iBF, jBF) + (dx1*dx2 + dy1*dy2)/ae(iE);
end
end
end
1 ответ
Попробуй поменять basisFunctions
от того, чтобы быть массивом ячеек, чтобы быть регулярным массивом.
Вы также можете попытаться встроить прямой вызов bilinearBasisFunction
в вашем цикле JBF, а не с помощью basisFunctions
, Создание и последующее использование анонимных функций в Matlab всегда медленнее, чем непосредственное использование целевой функции. Код может быть несколько более подробным, но будет быстрее.