Учетные данные AWS, необходимые для сегментов Common Crawl S3

Я пытаюсь получить доступ к сегменту S3 новостей Common Crawl, но все время получаю сообщение "Неустранимая ошибка: не удается найти учетные данные". Есть предложения, как это обойти? Насколько мне известно, Common Crawl даже не требует учетных данных?

0 ответов

Из доступного набора данных новостей - Обычное сканирование:

Вы можете получить доступ к данным даже без учетной записи AWS, добавив параметр командной строки --no-sign-request.

Я проверил это, запустив новый инстанс Amazon EC2 (без роли IAM) и выполнив команду:

aws s3 ls s3://commoncrawl/crawl-data/CC-NEWS/

Это дало мне ошибку: Unable to locate credentials

Затем я запустил его с дополнительным параметром:

aws s3 ls s3://commoncrawl/crawl-data/CC-NEWS/ --no-sign-request

Он успешно перечислил каталоги.

Другие вопросы по тегам