Учетные данные AWS, необходимые для сегментов Common Crawl S3

Question

Учетные данные AWS, необходимые для сегментов Common Crawl S3

Я пытаюсь получить доступ к сегменту S3 новостей Common Crawl, но все время получаю сообщение "Неустранимая ошибка: не удается найти учетные данные". Есть предложения, как это обойти? Насколько мне известно, Common Crawl даже не требует учетных данных?

0

amazon-s3 aws-credentials common-crawl

Источник

user10631953 06 сен '20 в 05:46

0 ответов

Другие вопросы по тегам amazon-s3 aws-credentials common-crawl

user174777 06 сен '20 в 12:38 2020-09-06 12:38 · Answer 1 · 2020-09-06 12:38

Из доступного набора данных новостей - Обычное сканирование:

Вы можете получить доступ к данным даже без учетной записи AWS, добавив параметр командной строки --no-sign-request.

Я проверил это, запустив новый инстанс Amazon EC2 (без роли IAM) и выполнив команду:

aws s3 ls s3://commoncrawl/crawl-data/CC-NEWS/

Это дало мне ошибку: Unable to locate credentials

Затем я запустил его с дополнительным параметром:

aws s3 ls s3://commoncrawl/crawl-data/CC-NEWS/ --no-sign-request

Он успешно перечислил каталоги.