Обучение модели с несколькими ответами на вопросы в формате PDF [закрыто]
У меня несколько файлов pdf (более 10000). Каждый из которых может иметь более 100-200 страниц.
Мне нужно обучить модель ответов на вопросы машинного обучения, чтобы детали можно было получать, задавая вопросы, и чтобы они наилучшим образом соответствовали всем PDF-файлам. В файлах PDF есть заголовки, абзацы и таблицы.
Я пробовал следующие подходы (застрял, поскольку он содержит только 512 и 1024 токенов):
- Берт
- Роберт
- Поиск плотного прохода