Фильтр пограничного атрибута при поиске мотива GraphFrames не работает

Question

Фильтр пограничного атрибута при поиске мотива GraphFrames не работает

У меня есть пример данных на графе семейства, к которому я хочу обратиться.

Я хотел бы использовать метод find для объекта GraphFrames, чтобы запросить мотив A->B, где ребро имеет тип "Мать".

Поскольку GraphFrames использует подмножество языка шифров Neo4J, мне было интересно, будет ли следующий запрос правильным?

graph.find("(A)-[edge:Mother]->(B)").show

Или как лучше всего реализовать это в GraphFrames?

GraphFrame(vertex, graph.edges.filter("attr=='Mother'")).vertices.show

Это не работает, так как я не могу фильтровать направление, поэтому я хочу получить только матерей:)

Любая идея?

3

apache-spark apache-spark-sql neo4j cypher graphframes

Источник

user3656912 16 июн '17 в 18:00

1 ответ

Решение

Другие вопросы по тегам apache-spark apache-spark-sql neo4j cypher graphframes

user8291724 13 сен '17 в 21:01 2017-09-13 21:01 · Accepted Answer · 2017-09-13 21:01

Предположим, это ваши тестовые данные:

import org.graphframes.GraphFrame

val edgesDf = spark.sqlContext.createDataFrame(Seq(
  ("a", "b", "Mother"),
  ("b", "c", "Father"),  
  ("d", "c", "Father"),
  ("e", "b", "Mother")    
)).toDF("src", "dst", "relationship")

val graph = GraphFrame.fromEdges(edgesDf)
graph.edges.show()

+---+---+------------+
|src|dst|relationship|
+---+---+------------+
|  a|  b|      Mother|
|  b|  c|      Father|
|  d|  c|      Father|
|  e|  b|      Mother|
+---+---+------------+

Вы можете использовать запрос мотива и применить к нему фильтр:

graph.find("()-[e]->()").filter("e.relationship = 'Mother'").show()

+------------+
|           e|
+------------+
|[a,b,Mother]|
|[e,b,Mother]|
+------------+

Или, поскольку ваш случай относительно прост, вы можете применить фильтр к краям графика:

graph.edges.filter("relationship = 'Mother'").show()

+---+---+------------+
|src|dst|relationship|
+---+---+------------+
|  a|  b|      Mother|
|  e|  b|      Mother|
+---+---+------------+

Вот некоторый альтернативный синтаксис (каждый получает тот же результат, что и выше):

graph.edges.filter($"relationship" === "Mother").show()
graph.edges.filter('relationship === "Mother").show()

Вы упоминаете фильтрацию по направлению, но направление каждого отношения кодируется в самом графике (то есть от источника к месту назначения).