блоки данных настраиваются с помощью cmd и R
Я пытаюсь использовать databricks cli и вызвать конфигурацию databricks. Вот как я это делаю из cmd
somepath>databricks configure --token
Databricks Host (should begin with https://): my_https_address
Token: my_token
Я хочу вызвать ту же команду, используя R. Итак, я сделал:
tool.control <- c('databricks configure --token'
,'my_https_address'
,'my_token')
shell(tool.control)
Я получаю следующую ошибку
Error in system(command, as.integer(flag), f, stdout, stderr, timeout) :
character string expected as first argument
Как я могу это исправить?
РЕДАКТИРОВАТЬ: попробовав предложение в комментарии, я получаю эту ошибку:
Databricks Host (should begin with https://): Aborted!
'https:' is not recognized as an internal or external command,
operable program or batch file.
'my_token' is not recognized as an internal or external command,
operable program or batch file.
[[1]]
[1] 1
[[2]]
[1] 1
[[3]]
[1] 1
Warning messages:
1: In FUN(X[[i]], ...) :
'databricks configure --token' execution failed with error code 1
2: In FUN(X[[i]], ...) :
'my_https_address' execution failed with error code 1
3: In FUN(X[[i]], ...) :
'my_token' execution failed with error code 1
2 ответа
Шаги по установке и настройке интерфейса командной строки Azure Databricks с помощью cmd:
Шаг 1. Установите Python, вам понадобится Python версии 2.7.9 и выше, если вы используете Python 2 или Python 3.6 и выше, если вы используете Python 3.
Шаг 2: запуститьpip install databricks-cli
используя соответствующую версию pip для вашей установки Python. Если вы используете Python 3, запуститеpip3 install databricks-cli
.
Шаг 3: Настройка аутентификации => Для аутентификации и доступа к REST API Databricks вы используете личные токены доступа. Токены похожи на пароли; вы должны относиться к ним осторожно. Срок действия токенов истекает, и их можно отозвать.
Щелкните значок профиля пользователя Профиль пользователя в правом верхнем углу рабочей области Azure Databricks.
Щелкните Параметры пользователя.
Перейдите на вкладку Access Tokens.
- Нажмите кнопку "Создать новый токен".
- При желании введите описание (комментарий) и срок действия.
- Нажмите кнопку "Создать".
- Обязательно "скопируйте " сгенерированный токен и сохраните в безопасном месте.
Шаг 4. Скопируйте URL-адрес хоста Databricks."https://centralus.azuredatabricks.net/"
и токен, созданный на предыдущем шаге.
Шаг 5: В cmd запустите "dbfs configure --token", как показано ниже:
dbfs configure --token
Databricks Host (should begin with https://): https://centralus.azuredatabricks.net
Token: dapi72026dsfsdfsh987hjfiu431
Step6: Успешно настроен Databricks CLI с помощью CMD.
Чтобы проверить, попробуйте запустить "databricks fs ls", проверьте, видите ли вы DBFS.
Ссылка: Databricks CLI
Надеюсь это поможет.
Если это отвечает на ваш запрос, нажмите "Отметить как ответ" и "проголосовать за" для того же. И, если у вас возникнут дополнительные вопросы, дайте нам знать.
Страницы справки дляsystem {base}
сказать:
Этот интерфейс с годами стал довольно сложным: см. system2 для более портативного и гибкого интерфейса, который рекомендуется для нового кода.
Поскольку вы не просили нас специально использовать Shell(), я полагаю, вы согласны с использованием system2() (?)
В любом случае, к сожалению, я не могу сделать это полностью автоматическим — добавление токена в качестве другого входа не работает странно — но это поможет вам достичь большей части цели.
Запустите первую команду, а затем вставьте токен, скопировав и вставив, или используя Command+Enter (или Control+Enter), чтобы R сделал это за вас, и нажмите Enter.
system2("databricks",
args = "configure --token",
input = "https://dbc-b6432663c-e88a.cloud.databricks.com") # the URL and token have been changed, these are just made up ones
asfewfwefaewfaefewfee898a98
system2("databricks", args = "workspace list")
"Users
Shared
Repos
spark_mooc_meta" # my workspaces
Надеюсь это поможет!