Я хочу спросить вас о структуре «запрос, ключ, значение» «преобразователя»
Я новичок в НЛП. Итак, я пытаюсь воспроизвести самый простой код преобразователя, который вам нужен.
Но у меня возник вопрос при выполнении.
В слое MultiHeadAttention я распечатал форму «запрос, ключ, значение». Однако были напечатаны разные формы «запрос» и «ключ, значение». «внимание к себе» в конечном итоге находит корреляцию с самим собой, которое отличается». Я не понимаю формы «запрос, ключ, значение».
введите здесь описание изображения . Значение «query, key, value» исходит из src, но почему значения разные?введите описание изображения здесь
введите описание изображения здесь
Я взял код отсюда.