Сбор карт не работает
У меня есть искровой датафрейм вроде этого:
+-----------+--------+----------+---------+
| obj_type| Cord1| Cord2| Cord3|
+-----------+--------+----------+---------+
|prox_fmr1t2|559.6759|-4684.2472|4281.8491|
| prox_never|560.0638|-4684.4120|4281.6181|
| prox_never|560.4613|-4684.3282|4281.6578|
+-----------+--------+----------+---------+
Я пытаюсь сохранить различные obj_type в список.
Работало раньше:
obj_list_cur=obj.select("obj_type").distinct().rdd.map(lambda row : row[0]).collect()
Но теперь выкидываем ошибку:
Error from python worker:
/opt/cloudera/parcels/Anaconda/bin/python: No module named pyspark
Эти команды работают, хотя:
obj_list_cur=obj.select("obj_type").distinct().rdd.collect()
obj_list_cur=obj.select("obj_type").distinct().collect()
Мне интересно, почему rdd.map(). Collect() не работает. Что может быть причиной такого поведения