Обучение нейронной сети с предложениями разной длины в системе обеспечения качества

Я пытаюсь внедрить систему контроля качества, следуя инструкциям, приведенным в этом документе. Я правильно импортировал некоторые наборы данных и преобразовал слова в векторах с помощью метода word2vec. После встраивания слова необходимо вставить вопросы и ответы в CNN. Каким должен быть размер входного тензора, учитывая, что каждый вопрос / ответ имеет разную длину? (каждый вопрос / ответ представляет собой массив векторов).

Выдержка из бумаги:

q_emb- вопрос после встраивания слова, аr_w_k- вектор слова длиныd.

Какое правильное значение M (длина Q/A) следует использовать? Можете ли вы показать мне некоторые методы, чтобы решить эту проблему или просто помочь? Спасибо

1 ответ

Решение

Определите максимальную длину векторного массива вопросов / ответов и сделайте свой входной тензор формы (num_samples, max_qa_length, word_embedding_size), На вопросы короче max_qa_length, дополните их нулевыми векторами в конце.

Другие вопросы по тегам