Описание тега graphframes

Библиотека графов на основе DataFrame для Apache Spark
0 ответов

Не могу настроить графические фреймы в моей локальной настройке Spark

Я пытаюсь настроить graphframe в моей локальной настройке искры с Python. Но почему-то я получаю следующую ошибку, когда запускаю следующий код в блокноте Jupyter. from pixiedust.packageManager import PackageManager pkg=PackageManager() pkg.installP…
12 янв '19 в 03:06
1 ответ

Ошибка при создании графического фрейма в pyspark

Я пытаюсь запустить приведенный ниже код для создания graphframe в pyspark, который настроен на моем локальном компьютере. Но я получаю ошибку. И я использую версию spark-2.4.0-bin-hadoop2.7. from pyspark.sql import SparkSession spark = SparkSession…
12 янв '19 в 06:21
1 ответ

Иерархическая обработка данных в Apache Spark

У меня есть набор данных в Spark (v2.1.1) с 3 столбцами (как показано ниже), содержащими иерархические данные. Моя цель - назначить добавочную нумерацию для каждой строки на основе иерархии родитель-потомок. Графически можно сказать, что иерархическ…
0 ответов

Spark Graphframes Вычисление PageRank и висячие вершины / ребра

У меня есть график, который выглядит так: g.vertices.show() +---+ | id| +---+ | 1| | 2| | 3| | 4| +---+ g.edges.show() +---+----+ |src| dst| +---+----+ | 1| 2| | 2| 3| | 3| 4| | 4| 1| | 4|null| +---+----+ теперь, как вы можете видеть вектику 4 имеет…
23 окт '18 в 13:27
2 ответа

Как использовать графические рамки внутри SPARK в кластере HDInsight

Я настроил кластер SPARK в HDInsight и пытался использовать GraphFrames, используя это руководство. Я уже использовал пользовательские сценарии при создании кластера, чтобы включить GraphX на кластере искр, как описано здесь. Когда я запускаю блокно…
0 ответов

Найдите кратчайший путь во взвешенном орграфе с помощью GraphFrames Spark

Графический пакет sparkFrames великолепен. Я могу найти кратчайший путь от "а" до "г" с помощью команды val results = g.shortestPaths.landmarks(Seq("a", "d")).run() но что, как я могу определить взвешенный граф и вычислить кратчайший путь между двум…
08 фев '17 в 08:18
3 ответа

Невозможно запустить базовый пример GraphFrames

Попытка запустить простой пример GraphFrame с использованием pyspark. версия спарк: 2.0 версия графического фрейма: 0.2.0 Я могу импортировать графические фреймы в Jupyter: from graphframes import GraphFrame GraphFrame graphframes.graphframe.GraphFr…
01 сен '16 в 01:25
0 ответов

Как узнать соседние вершины конкретной вершины в графе (pyspark)?

Я пытаюсь найти соседние вершины конкретной вершины, используя API графического фрейма, доступный в pyspark. Как мне это сделать? Например, рассмотрим следующие ребра графа (он должен рассматриваться как двунаправленный, хотя вход является направлен…
0 ответов

Прегелевые алгоритмы Graphx или Graphframes?

Я пытаюсь реализовать некоторые алгоритмы графов, используя pregel на sparkx, а затем я увидел, что api графических фреймов также имеет pregel api. https://graphframes.github.io/graphframes/docs/_site/api/python/graphframes.lib.html Я заметил, что у…
24 фев '19 в 09:38
1 ответ

Установка пакета graphframes в автономный кластер Spark

У меня есть автономный кластер pyspark (нет доступа в интернет), где мне нужно установить библиотеку graphframes. Я вручную загрузил jar отсюда, добавленный в $SPARK_HOME/jars/, и затем, когда я пытаюсь использовать его, я получаю следующую ошибку: …
31 окт '18 в 12:14
1 ответ

Создание DSEGraphFrames в Java или Scala с использованием SparkSession

Я пытаюсь получить DSEGraphFrame моих графиков DSE в Java или Scala. Я использую документацию блога, следующим образом //load a graph in Java DseGraphFrame graph = DseGraphFrameBuilder.dseGraph("test", spark); // load a graph in scala val graph = sp…
0 ответов

Сообщение об ошибке при запуске графических фреймов в spark pyspark

Я установил пакет GraphFrames в спарк, я следовал инструкциям по этой ссылке: https://www.datareply.co.uk/blog/2016/9/20/running-graph-analytics-with-spark-graphframes-a-simple-example Когда я пытаюсь выполнить следующий код, я получаю сообщение об …
11 мар '18 в 18:40
0 ответов

Производительность подключенных компонентов GraphFrames

Когда я пытаюсь сгенерировать связанные компоненты с помощью графических фреймов, это занимает значительно больше времени, чем я ожидал. Я работаю на спарке 2.1, графических фреймах 0.5 и AWS EMR с 3 экземплярами r4.xlarge. При генерации подключенны…
1 ответ

Фильтр пограничного атрибута при поиске мотива GraphFrames не работает

У меня есть пример данных на графе семейства, к которому я хочу обратиться. Я хотел бы использовать метод find для объекта GraphFrames, чтобы запросить мотив A->B, где ребро имеет тип "Мать". Поскольку GraphFrames использует подмножество языка шифро…
4 ответа

Нет модуля с именем graphframes Jupyter Notebook

Я следую этому руководству по установке, но у меня возникла следующая проблема с использованием graphframes from pyspark import SparkContext sc =SparkContext() !pyspark --packages graphframes:graphframes:0.5.0-spark2.1-s_2.11 from graphframes import…
11 май '18 в 06:19
1 ответ

Ошибка при запуске функций PageRank и BFS на графических фреймах в PySpark

Я новичок в Spark, и я изучаю его на Cloudera Distr для Hadoop (CDH). Я пытаюсь выполнить функции PageRank и BFS через блокнот Jupyter, который был запущен с помощью следующей команды: pyspark --packages graphframes:graphframes:0.1.0-spark1.6,com.da…
4 ответа

Импорт пакетов PySpark

Я скачал graphframes пакет ( отсюда) и сохранил его на моем локальном диске. Теперь я хотел бы использовать это. Итак, я использую следующую команду: IPYTHON_OPTS="notebook --no-browser" pyspark --num-executors=4 --name gorelikboris_notebook_1 --py-…
04 апр '16 в 07:49
1 ответ

Можно ли использовать библиотеку Gelly для графовых запросов во Flink, аналогично Graph Frame в Spark

Может ли библиотека графов Flink Gelly выполнять разбиение графа, сопоставление с образцом графа, соединения и т.д.
03 апр '18 в 12:54
1 ответ

Build.sbt ломается при добавлении сборки GraphFrames с Scala 2.11

Я пытаюсь добавить GraphFrames в мое приложение Scala Spark, и это было нормально, когда я добавил приложение, основанное на 2.10. Однако, как только я попытался собрать его с помощью GraphFrames и Scala 2.11, он сломался. Проблема заключается в том…
22 окт '17 в 19:29
0 ответов

Apache Spark вычисление кратчайшего пути

Я пытаюсь вычислить кратчайший путь в большой сети от заданного источника к заданной цели на основе весов без использования Apache Spark. Поскольку весь мой другой код написан на python, я не хочу ничего менять. Это должно быть как-то возможно, не т…