Как выбрать значения из столбца, в котором есть данные массива

    +--------------------+--------------------+
|              _VALUE|             paraarr|
+--------------------+--------------------+
|Archer, Edward Pa...|[, [[, Arbitrator...|
|Archer, Edward Pa...|[, [[, Member:],,...|
|Archer, Edward Pa...|[, [[, Experience...|
|Archer, Edward Pa...|[, [[, Publicatio...|
|Belcher, A. Lee (...|[, [[, Arbitrator...|
|Belcher, A. Lee (...|[, [[, Member:],,...|
|Belcher, A. Lee (...|[, [[, Experience...|
|Bloodsworth, Davi...|[, [[, Arbitrator...|
|Bloodsworth, Davi...|[, [[, Member:],,...|
|Bloodsworth, Davi...|[, [[, Experience...|
|Bloodsworth, Davi...|[, [[, Public Sec...|
|Bloodsworth, Davi...|[, [[, Issue:],,,,]]|
|Bloodsworth, Davi...|[, [[, Industry:]...|
|Brent, Daniel F. ...|[, [[, Arbitrator...|
|Brent, Daniel F. ...|[, [[, Profession...|
|Brent, Daniel F. ...|[, [[, Arbitratio...|
|Brent, Daniel F. ...|[, [[, Permanent ...|
|Brent, Daniel F. ...|[, [[, Issues:],,...|
|Brent, Daniel F. ...|[, [[, Industries...|
|Chiesa, Mario (Mi...|[, [[, Arbitrator...|
+--------------------+--------------------+

Используя AWS glue sql context, я хочу изучить столбец paraar и извлечь данные из этого столбца. Я новичок в AWS glue и не могу понять, как мне это сделать.

Я выполнил приведенный ниже код, чтобы получить этот столбец данных.

from pyspark.sql.functions import *
dyf1.toDF().createOrReplaceTempView("x3")
df1=spark.sql("select p._VALUE,explode(para_array) as paraarr from x2")

0 ответов

Другие вопросы по тегам