Я могу подключиться к базе данных с помощью ROracle. Как я могу подключиться, используя spark_read_jdbc?

Я подключаюсь к базе данных в R с помощью Roracle. Увидеть ниже:

library(ROracle)

#Connect and send query
drv <- dbDriver("Oracle")
dbCon <- dbConnect(drv = drv, dbname = "My_Database",
                   username = un,
                   password = pw)
dat <- dbGetQuery(conn = dbCon, statement = 'SELECT * FROM TEST1.Test_Table')

Примечание: "My_Database" включен в tnsnames.ora

Я пытаюсь подключиться к Oracle, используя Spark, так как данные могут быть намного больше. Прямо сейчас у меня есть это:

library(sparklyr)
config <- spark_config()
config[["defaultPackages"]] <- c("org.postgresql:postgresql:9.4.1212")

sc <- spark_connect(master = "local", config = config)

spark_read_jdbc(sc, "jdbc-table", list(
  driver = "org.postgresql.Driver",
  url = "jdbc:postgresql://host/database",
  dbtable = "table-name", 
  user = "user-name",
  password = "password"))

Я не уверен, как редактировать эту информацию. Как именно я получу URL? Из tnsnames.ora вот что у меня есть: (где #### удаляется информация)

My_Database= 
(description=
  (load_balance=off)(failover=on)
  (address=(protocol=tcp)(host=####)(port=####))
  (address=(protocol=tcp)(host=####) (port=####))
  (connect_data=
     (service_name=#####.com)
     (failover_mode=(type=select)(method=basic))
  )
)

Я очень новичок, поэтому любая информация полезна! Даже если вы можете отправить мне несколько ссылок на изучение Spark в R - это было бы здорово.

Спасибо за чтение.

0 ответов

Другие вопросы по тегам