Какая наилучшая структура должна иметь набор видеоданных, чтобы использовать его с PyTorch? [закрыто]
Я новичок в глубоком обучении и особенно в PyTorch. У меня есть каталог клипов на языке жестов .mp4 и annotations.txt, который включает только метки, соответствующие клипам. Каждый клип - это слово на языке жестов, а каждый ярлык - его перевод на естественный язык.
Какова предлагаемая структура моего набора данных видео, чтобы использовать загрузчики данных PyTorch? Есть ли стандартный способ структурировать наборы видеоданных?
Итак, я пришел к выводу, что я должен создать папку «data» с подпапками для каждого класса и скопировать туда видео .mp4 в соответствующую папку класса. Это хорошее начало, если я хочу использовать загрузчики данных PyTorch?