Можем ли мы сканировать и индексировать документы Google Диска, используя Nutch и Solr?

Я попытался проиндексировать общедоступный URL-адрес документа на диске Google, но, похоже, он не работает. Есть ли способ сканировать документы Google Drive через Nutch и сделать их индекс с помощью Solr?

1 ответ

Используйте Google Drive API для чтения / управления файлами

https://developers.google.com/drive/web/about-sdk

Страница Drive Public URL не будет иметь прямых ссылок на подкаталоги, поэтому вы ничего не получите, если будете сканировать эти страницы.

Другие вопросы по тегам