Я могу подключиться к базе данных с помощью ROracle. Как я могу подключиться, используя spark_read_jdbc?
Я подключаюсь к базе данных в R с помощью Roracle. Увидеть ниже:
library(ROracle)
#Connect and send query
drv <- dbDriver("Oracle")
dbCon <- dbConnect(drv = drv, dbname = "My_Database",
username = un,
password = pw)
dat <- dbGetQuery(conn = dbCon, statement = 'SELECT * FROM TEST1.Test_Table')
Примечание: "My_Database" включен в tnsnames.ora
Я пытаюсь подключиться к Oracle, используя Spark, так как данные могут быть намного больше. Прямо сейчас у меня есть это:
library(sparklyr)
config <- spark_config()
config[["defaultPackages"]] <- c("org.postgresql:postgresql:9.4.1212")
sc <- spark_connect(master = "local", config = config)
spark_read_jdbc(sc, "jdbc-table", list(
driver = "org.postgresql.Driver",
url = "jdbc:postgresql://host/database",
dbtable = "table-name",
user = "user-name",
password = "password"))
Я не уверен, как редактировать эту информацию. Как именно я получу URL? Из tnsnames.ora вот что у меня есть: (где #### удаляется информация)
My_Database=
(description=
(load_balance=off)(failover=on)
(address=(protocol=tcp)(host=####)(port=####))
(address=(protocol=tcp)(host=####) (port=####))
(connect_data=
(service_name=#####.com)
(failover_mode=(type=select)(method=basic))
)
)
Я очень новичок, поэтому любая информация полезна! Даже если вы можете отправить мне несколько ссылок на изучение Spark в R - это было бы здорово.
Спасибо за чтение.