градиент, подходящий для вычисления cp-разложения тензора третьего порядка

Я пытаюсь сделать градиент приличным, чтобы вычислить разложение CP тензора третьего порядка. Я использую тензор, и я в этом новичок. И я не знаю, как вычислить градиент.

Итак, вот что у нас есть на данный момент:

def CP_GD(T, rank, epsilon=1e-5,max_iters=100,lr=1e-2,verbose=True,errors_at_iterations=[]):
    # Initialize A, B and C

    dim1= T.shape[0]
    dim2= T.shape[1]
    dim3= T.shape[2]
    A= tl.tensor(np.random.normal(0,1,[dim1,rank]))
    B= tl.tensor(np.random.normal(0,1,[dim2,rank]))
    C= tl.tensor(np.random.normal(0,1,[dim3,rank]))


    T_approx_old = tl.kruskal_to_tensor((np.ones(rank),[A,B,C]))# YOUR CODE HERE #
    it = 1
    while True: # repeat until convergence
        # compute gradients wrt A B and C and do a gradient step




        # check for convergence:
        T_approx_new = tl.kruskal_to_tensor((np.ones(rank),[A,B,C]))
        reconstruction_error =  tl.norm(T_approx_new-T)
        errors_at_iterations.append(reconstruction_error)


        if tl.norm(T_approx_old - T_approx_new)/tl.norm(T_approx_old) < epsilon or it > max_iters:
            return (A,B,C)
        if verbose:
            print(it, " - reconstruction error: ",reconstruction_error, "convergence: ", tl.norm(T_approx_old - T_approx_new)/tl.norm(T_approx_old))

        T_approx_old = T_approx_new
        it += 1

1 ответ

Вы можете вычислить градиенты вручную или, в качестве альтернативы, использовать autograd. У TensorLy есть бэкэнд-система, которая позволяет вам запускать вычисления с помощью NumPy, PyTorch, TensorFlow и т. Д. Если вы используете какой-либо из бэкэндов, поддерживающих автогрейд, вы можете использовать авто-дифференциацию для прямого получения градиентов. Взять, к примеру, блокноты. Например, здесь выполняется разложение Такера с помощью градиентного спуска с TensorLy и PyTorch.

Другие вопросы по тегам