Некорректная выходная матрица с использованием алгоритма Штрассена с пустыми матрицами

Я пытаюсь реализовать алгоритм умножения матриц Штрассена, как описано в CLRS, используя Python 3 и пустые матрицы.

Проблема заключается в том, что выходная матрица C возвращается в виде нулевой матрицы вместо правильного продукта. Я не уверен, почему моя реализация не работает, но подозреваю, что это как-то связано с созданием матрицы C с каждым рекурсивным вызовом. Буду признателен за любое объяснение того, что я делаю неправильно и как я могу это исправить.

Спасибо!

import numpy as np

def strassen(A,B):
    n = A.shape[0]
    C = np.zeros((n*n), dtype=np.int).reshape(n,n)
    if n == 1:
        C[0][0] = A[0][0] * B[0][0]

    else:
        k = int(n/2) 

        A11,A21,A12,A22 = A[:k,:k], A[k:, :k], A[:k, k:], A[k:, k:]
        B11,B21,B12,B22 = B[:k,:k], B[k:, :k], B[:k, k:], B[k:, k:]
        C11,C21,C12,C22 = C[:k,:k], C[k:, :k], C[:k, k:], C[k:, k:]

        S1 = B12 - B22
        S2 = A11 + A12
        S3 = A21 + A22
        S4 = B21 - B11
        S5 = A11 + A22
        S6 = B11 + B22
        S7 = A12 - A22
        S8 = B21 + B22
        S9 = A11 - A21
        S10= B11 + B12

        P1 = strassen(A11, S1)
        P2 = strassen(S2, B22)
        P3 = strassen(S3, B11)
        P4 = strassen(A22, S4)
        P5 = strassen(S5, S6)
        P6 = strassen(S7, S8)
        P7 = strassen(S9, S10)

        C11 = P5 + P4 - P2 + P6
        C12 = P1 + P2
        C21 = P3 + P4
        C22 = P5 + P1 - P3 - P7


    return C

1 ответ

Решение

Хорошо, я заставил его работать, просто обновив срезы C[:k,:k] новыми значениями вместо создания новых переменных C11, C12 ..ect. так как это создает новую матрицу и не является ссылкой на исходную матрицу C.

Другие вопросы по тегам