PDFQuery + файлы на сервере

Я пытаюсь найти текстовую строку, скажем, "может быть", в документе, который находится на " https://developer.apple.com/library/ios/documentation/ides/conceptual/AppDistributionGuide/AppDistributionGuide.pdf".

Для этого я использую PDFQuery. Первоначально я скачал PDF на моей машине и сделал мой код. Работает отлично. Но когда я попытался ввести URL-адрес сервера в расположение файла, это показывает мне ошибку. Я знаю, что библиотека PDFQuery разработана для работы на локальных машинах.

Есть ли способ, чтобы я мог что-то выяснить и решить мою проблему. Это часть моего курсового проекта, и модуль поиска PDF, который я должен разработать, должен быть развернут в IBM Bluemix и запускаться оттуда. Только эта часть находится на рассмотрении в моем проекте. Любая помощь приветствуется.

Заранее спасибо.

1 ответ

Разбейте проблему на две части.

я) скачать файл. II) обработать файл.

Вот некоторая помощь с шагом i) Как мне загрузить файл через HTTP, используя Python?

Другие вопросы по тегам