Google Cloud/BigQuery/ Расположение данных Genomics

Некоторые из работ нашей компании требуют, чтобы данные в облаке хранились в США.

Для Google Cloud я могу указать местоположения сегментов в США. https://cloud.google.com/storage/docs/bucket-locations

Но для BigQuery и Google Genomics в API нет таких опций. Кто-нибудь знает страны, где хранятся данные для этих услуг?

3 ответа

По умолчанию все данные в BigQuery находятся в центрах обработки данных в США. Мы только что объявили о доступности европейской зоны, но никакие данные не будут перемещены туда, если вы не запросите ее.

См. http://googlecloudplatform.blogspot.com/2015/04/take-your-big-data-to-new-places-with-Google-BigQuery.html.

Трудно понять, в каких контейнерах хранит данные серверный сервер Google Genomics, но если вы выполните следующую команду для их общедоступных данных геномики, все их сегменты будут базироваться в США:

$ gsutil ls -L -b gs://genomics-public-data
gs://genomics-public-data/ :
    Storage class:                  STANDARD
    Location constraint:            US
    Versioning enabled:             None
    Logging configuration:          None
    Website configuration:          None
    CORS configuration:             None
    Lifecycle configuration:        None
    ACL:                            []
    Default ACL:                    []

Так что, скорее всего, все они базируются в США.

Надеюсь, это поможет, Пол

Публичные данные хранятся в США. Для ваших собственных данных Google Cloud Storage позволяет вам выбрать регион, включая варианты для США и других стран. Информация Фелипе о BigQuery верна.

Для операций чтения и вариантов, импортированных в Google Genomics через API Genomics, все данные хранятся только в пределах США, пока API находится в бета-версии. Мы ждем отзывов от сообщества о требованиях к локальности данных.

Другие вопросы по тегам