Найти все поддеревья в дереве, соответствующие данному поддереву в Java
Я пишу код на Java, который использует неупорядоченное корневое дерево, где каждый узел может иметь любое количество дочерних узлов. Учитывая дерево T и поддерево S, я хочу быть в состоянии найти все поддеревья в T, которые соответствуют S (то есть все поддеревья в T, которые изоморфны S).
Поддерево T изоморфно S, если узлы S можно отобразить на узлы T таким образом, что ребра S отображаются в ребра в T.
Был задан предыдущий вопрос о том, как найти, содержит ли дерево другое поддерево, однако я хочу иметь возможность найти ВСЕ поддеревья в T, которые соответствуют S. Кроме того, я хочу иметь возможность сопоставлять каждый узел в каждом совпадении в T с соответствующий узел в с.
То есть, когда совпадение найдено, оно должно быть возвращено не просто как указатель на узел в T, где укоренено дерево, совпадающее с S, но совпадение должно быть возвращено как нечто вроде списка пар указателей на узлы [(T1,S1),(T2,S2),...(Tn,Sn)], так что T1 является указателем на узел в T, который отображается на узел S1 в поддереве и так далее.
В качестве альтернативы просто список пар значений может быть возвращен, поскольку каждый узел в дереве T и поддереве S имеет уникальный целочисленный идентификатор, связанный с ним.
Например:
Дано дерево Т следующим образом:
a
/ \
b c
/ \
d e
и поддерево S как:
x
/ \
y z
следующий список совпадений должен быть возвращен:
[(a,x),(b,y),(c,z)] [(b, x), (d, y), (e, z)]
Уникальное соответствие определяется набором узлов в T, а не отображением между узлами в T и S.
Итак, следующий матч:
[(a, x), (b,z), (c,y)]
считается дубликатом
[(a, x), (b,y), (c,z)]
поскольку они имеют одинаковый набор узлов из T (a,b,c), поэтому должно быть возвращено только одно совпадение.
В качестве другого примера приведено дерево T:
a
/|\
b c d
и поддерево S:
x
/ \
y z
следующий список совпадений должен быть возвращен:
[(a,x),(b,y),(c,z)] [(a, x), (b, y), (d, z)] [(a, x), (c, y), (д, г)]
Может кто-нибудь привести пример кода, как это сделать?
Изменить (в связи с комментарием Криса Каннона):
Я думаю, ты хочешь, чтобы кто-то написал для тебя ответ? Как далеко вы продвинулись? Какой код вы написали? - Крис Каннон 1 час назад
У меня есть следующий код, который при запуске создает список (matchList) указателей на узлы в дереве, где укоренены поддеревья, соответствующие данному поддереву. Однако может быть несколько поддеревьев, укорененных в одном и том же узле, и в настоящее время каждый узел будет добавлен не более одного раза в matchList, независимо от того, сколько совпадений там находится.
Кроме того, я не могу понять, как создать описанное выше сопоставление между узлами в поддереве и узлами в соответствии, найденном в исходном дереве.
package Example;
import java.util.LinkedList;
import java.util.Vector;
public class PartialTreeMatch {
public static void main(String[] args) {
NodeX testTree = createTestTree();
NodeX searchTree = createSearchTree();
System.out.println(testTree);
System.out.println(searchTree);
partialMatch(testTree, searchTree);
}
static LinkedList<NodeX> matchesList = new LinkedList<NodeX>();
private static boolean partialMatch(NodeX tree, NodeX searchTree) {
findSubTreeInTree(tree, searchTree);
System.out.println(matchesList.size());
for (NodeX n : matchesList) {
if (n != null) {
System.out.println("Found: " + n);
}
}
return false;
}
private static NodeX findSubTreeInTree(NodeX tree, NodeX node) {
if (tree.value == node.value) {
if (matchChildren(tree, node)) {
matchesList.add(tree);
}
}
NodeX result = null;
for (NodeX child : tree.children) {
result = findSubTreeInTree(child, node);
if (result != null) {
if (matchChildren(tree, result)) {
matchesList.add(result);
}
}
}
return result;
}
private static boolean matchChildren(NodeX tree, NodeX searchTree) {
if (tree.value != searchTree.value) {
return false;
}
if (tree.children.size() < searchTree.children.size()) {
return false;
}
boolean result = true;
int treeChildrenIndex = 0;
for (int searchChildrenIndex = 0; searchChildrenIndex < searchTree.children
.size(); searchChildrenIndex++) {
// Skip non-matching children in the tree.
while (treeChildrenIndex < tree.children.size()
&& !(result = matchChildren(tree.children
.get(treeChildrenIndex), searchTree.children
.get(searchChildrenIndex)))) {
treeChildrenIndex++;
}
if (!result) {
return result;
}
}
return result;
}
private static NodeX createTestTree() {
NodeX subTree2 = new NodeX('A');
subTree2.children.add(new NodeX('A'));
subTree2.children.add(new NodeX('A'));
NodeX subTree = new NodeX('A');
subTree.children.add(new NodeX('A'));
subTree.children.add(new NodeX('A'));
subTree.children.add(subTree2);
return subTree;
}
private static NodeX createSearchTree() {
NodeX root = new NodeX('A');
root.children.add(new NodeX('A'));
root.children.add(new NodeX('A'));
return root;
}
}
class NodeX {
char value;
Vector<NodeX> children;
public NodeX(char val) {
value = val;
children = new Vector<NodeX>();
}
public String toString() {
StringBuilder sb = new StringBuilder();
sb.append('(');
sb.append(value);
for (NodeX child : children) {
sb.append(' ');
sb.append(child.toString());
}
sb.append(')');
return sb.toString();
}
}
Приведенный выше код пытается найти все подграфы в:
A
/|\
A A A
/ \
A A
какой матч:
A
/ \
A A
Код успешно обнаруживает совпадение с корнем верхнего узла в первом дереве и третьего потомка первого дерева. Однако на самом деле в верхнем узле коренится 3 совпадения, а не только одно. Кроме того, код не создает отображение между узлами в дереве и узлами в поддереве, и я не могу понять, как это сделать.
Кто-нибудь может дать какой-нибудь совет, как это сделать?
2 ответа
Я думаю, что ваш рекурсивный метод должен возвращать список частичных совпадений, а не просто логическое значение. Это будет иметь большое значение для решения обеих ваших проблем (необходимость возврата списка совпадений, а также поиска нескольких совпадений).
Java-подобный псевдокод для рекурсивной функции может выглядеть примерно так:
findMatches(treeNode, searchNode) {
if searchNode has no children {
// search successful
pairs = [] // empty list
return [pairs] // list of lists
}
else {
matches = [] // empty list
searchChild = first child node of searchNode
searchNode2 = searchNode with searchChild removed
// NOTE: searchNode2 is created by doing a shallow copy of just the node
// (not it's children) and then removing searchChild from the child list.
for each treeChild in treeNode.children {
if treeChild.value == searchChild.value {
treeNode2 = treeNode with treeChild removed // also a shallow copy
childMatches = findMatches(searchChild, treeChild)
nodeMatches = findMatches(treeNode2, searchNode2)
// cross-product
for each nodeMatchPairs in nodeMatches {
for each childMatchPairs in childMatches {
fullMatchPairs = [(searchChild, treeChild)]
+ childMatchPairs + nodeMatchPairs // concatenate lists
add fullMatchPairs to matches
}
}
}
}
return matches
}
}
Обратите внимание, что эта функция не проверяет treeNode.value == searchNode.value и не добавляет его в список. Звонящий должен сделать это. Эта функция должна быть запущена на каждом узле дерева.
В настоящее время он, вероятно, использует слишком много памяти, но это можно оптимизировать.