Matlab медленная производительность с использованием замыканий

Я кодирую решение для уравнения Пуассона на двумерном прямоугольнике, используя конечные элементы. Чтобы упростить код, я сохраняю дескрипторы базовых функций в массиве, а затем зацикливаю эти базовые функции для создания моей матрицы и правой части. Проблема в том, что даже для очень грубых сеток это слишком медленно. Для сетки 9x9 (с использованием Dirichlet BC, для решения которой нужно 49 узлов) это занимает около 20 секунд. Используя профиль, я заметил, что около половины времени тратится на доступ (а не на выполнение) моих базовых функций.

Профилировщик говорит matrix_assembly>@(x,y)bilinearBasisFunction(x,y,xc(k-1),xc(k),xc(k+1),yc(j-1),yc(j),yc(j+1)) (156800 calls, 11.558 sec)собственное время (без выполнения билинейного базового кода) превышает 9 секунд. Есть идеи, почему это может быть так медленно?

Вот часть кода, я могу опубликовать больше, если это необходимо:

%% setting up the basis functions, storing them in cell array
basisFunctions = cell(nu, 1); %nu is #unknowns 
i = 1;
for j = 2:length(yc) - 1
for k = 2:length(xc) - 1
    basisFunctions{i} = @(x,y) bilinearBasisFunction(x,y, xc(k-1), xc(k),...
        xc(k+1), yc(j-1), yc(j), yc(j+1)); %my code for bilinear basis functions
    i = i+1;
end
end

%% Assemble matrices and RHS
M = zeros(nu,nu);
S = zeros(nu,nu);
F = zeros(nu, 1);

for iE = 1:ne
for iBF = 1:nu
    [z1, dx1, dy1] = basisFunctions{iBF}(qx(iE), qy(iE));

    F(iBF) = F(iBF) + z1*forcing_handle(qx(iE),qy(iE))/ae(iE);

    for jBF = 1:nu
        [z2, dx2, dy2] = basisFunctions{jBF}(qx(iE), qy(iE));

        %M(iBF,jBF) = M(iBF,jBF) + z1*z2/ae(iE);
        S(iBF,jBF) = S(iBF, jBF) + (dx1*dx2 + dy1*dy2)/ae(iE);
    end        
end
end

1 ответ

Попробуй поменять basisFunctions от того, чтобы быть массивом ячеек, чтобы быть регулярным массивом.

Вы также можете попытаться встроить прямой вызов bilinearBasisFunctionв вашем цикле JBF, а не с помощью basisFunctions, Создание и последующее использование анонимных функций в Matlab всегда медленнее, чем непосредственное использование целевой функции. Код может быть несколько более подробным, но будет быстрее.

Другие вопросы по тегам