Есть ли способ проверить, какую PDF-стратегию будет использовать FSCrawler?

Я использую функцию REST FSCrawler для сканирования PDF-файлов по мере их загрузки. В настоящее время я используюocr_and_textpdf, однако ocr занимает слишком много времени, чтобы пользователь ждал ответа. Я хотел бы синхронно отправить PDF-файл в fscrawler, чтобы использовать извлечение текста, и если это не сработает, отправить в асинхронную фоновую задачу для ocr.

Есть ли способ сделать это с помощью FSCrawler? Или есть способ использовать несколько стратегий PDF?

1 ответ

Вам следует попробовать изменить pdf_strategy на auto.

Другие вопросы по тегам