Сбор карт не работает

У меня есть искровой датафрейм вроде этого:

+-----------+--------+----------+---------+
|   obj_type|   Cord1|     Cord2|    Cord3|
+-----------+--------+----------+---------+
|prox_fmr1t2|559.6759|-4684.2472|4281.8491|
| prox_never|560.0638|-4684.4120|4281.6181|
| prox_never|560.4613|-4684.3282|4281.6578|
+-----------+--------+----------+---------+

Я пытаюсь сохранить различные obj_type в список.

Работало раньше:

obj_list_cur=obj.select("obj_type").distinct().rdd.map(lambda row : row[0]).collect()

Но теперь выкидываем ошибку:

Error from python worker:
  /opt/cloudera/parcels/Anaconda/bin/python: No module named pyspark

Эти команды работают, хотя:

obj_list_cur=obj.select("obj_type").distinct().rdd.collect()
obj_list_cur=obj.select("obj_type").distinct().collect()

Мне интересно, почему rdd.map(). Collect() не работает. Что может быть причиной такого поведения

0 ответов

Другие вопросы по тегам