Обучение модели с несколькими ответами на вопросы в формате PDF [закрыто]

У меня несколько файлов pdf (более 10000). Каждый из которых может иметь более 100-200 страниц.

Мне нужно обучить модель ответов на вопросы машинного обучения, чтобы детали можно было получать, задавая вопросы, и чтобы они наилучшим образом соответствовали всем PDF-файлам. В файлах PDF есть заголовки, абзацы и таблицы.

Я пробовал следующие подходы (застрял, поскольку он содержит только 512 и 1024 токенов):

  1. Берт
  2. Роберт
  3. Поиск плотного прохода

0 ответов