Конвейеры платформы GCP AI - KFP - Использование управляемого хранилища - проблема с cloudqlproxy
У меня проблема с настройкой GCP AI Platform Pipelines - Kubeflow Pipelines v1.4.1 с «Использовать управляемое хранилище». Ни одна конфигурация не позволяет мне (ошибки в службе KFP) использовать «Использовать управляемое хранилище», но позвольте сосредоточиться на конкретном описанном ниже.
Моя установка:
- частный кластер с версией "1.17.15-gke.800" в настраиваемой сети / подсети и включенной идентификации рабочей нагрузки
- частный mysql 8.0 в той же настраиваемой сети / подсети, что и GKE
- GCS
- «Использовать управляемое хранилище», где указана вся необходимая информация: имя GCS, имя подключения для БД, пользователь, пароль и префикс БД.
- идентификация рабочей нагрузки (для упрощения всех KSA (учетная запись службы K8s) была сопоставлена с одной учетной записью службы Google с ролью владельца)
Имейте в виду, что установка с помощью GKE и KFP отлично работает без опции «Использовать управляемое хранилище», но в случае использования «Использовать управляемое хранилище» она не работает:
- мл-трубопровод:
- статус:
- Ошибки модуля: CrashLoopBackOff
- Нет минимальной доступности
- журналы:
packets.go:36: unexpected EOF
CETdriver: bad connection
- метаданные-grpc-развертывание:
- статус:
- Ошибки модуля: CrashLoopBackOff
- Нет минимальной доступности
- журналы:
Non-OK-status: status status: Internal: mysql_real_connect failed: errno: 2013, error: Lost connection to MySQL server at 'handshake: reading inital communication packet', system error: 11MetadataStore cannot be created with the given connection config.
- cloudsqlproxy и mysql (те же логи):
- статус: хорошо
- журналы:
couldn't connect to "<db_connection_string>": googleapi: Error 401: Request had invalid authentication credentials. Expected OAuth 2 access token, login cookie or other valid authentication credential. See https://developers.google.com/identity/sign-in/web/devconsole-project.
More details:
Reason: authError, Message: Invalid Credentials
Похоже, что есть проблема с сервисом / модулем cloudqlproxy, который не может установить соединение с БД. Это ошибка в этой функции или неправильная конфигурация?
1 ответ
У меня была такая же проблема, и я исправил ее:
- Включение GCP SQL API.
- Запись имени пользователя root в параметрах управляемого хранилища. По умолчанию это не root, как указано в описании.