Обучение нейронной сети с предложениями разной длины в системе обеспечения качества
Я пытаюсь внедрить систему контроля качества, следуя инструкциям, приведенным в этом документе. Я правильно импортировал некоторые наборы данных и преобразовал слова в векторах с помощью метода word2vec. После встраивания слова необходимо вставить вопросы и ответы в CNN. Каким должен быть размер входного тензора, учитывая, что каждый вопрос / ответ имеет разную длину? (каждый вопрос / ответ представляет собой массив векторов).
Выдержка из бумаги:
q_emb- вопрос после встраивания слова, аr_w_k- вектор слова длиныd.
Какое правильное значение M (длина Q/A) следует использовать? Можете ли вы показать мне некоторые методы, чтобы решить эту проблему или просто помочь? Спасибо
1 ответ
Определите максимальную длину векторного массива вопросов / ответов и сделайте свой входной тензор формы (num_samples, max_qa_length, word_embedding_size)
, На вопросы короче max_qa_length
, дополните их нулевыми векторами в конце.