Синтаксический анализ C в python с libclang, но сгенерировал неправильный AST

Я хочу использовать связывающий Python libclang для генерации AST кода C. ОК, исходный код изображен ниже.

#include <stdlib.h>
#include "adlist.h"
#include "zmalloc.h"


list *listCreate(void)
{
    struct list *list;

    if ((list = zmalloc(sizeof(*list))) == NULL)
        return NULL;
    list->head = list->tail = NULL;
    list->len = 0;
    list->dup = NULL;
    list->free = NULL;
    list->match = NULL;
    return list;
}

И реализация, которую я написал:

#!/usr/bin/python
# vim: set fileencoding=utf-8


import clang.cindex
import asciitree
import sys

def node_children(node):
    return (c for c in node.get_children() if c.location.file.name == sys.argv[1])

def print_node(node):
    text = node.spelling or node.displayname
    kind = str(node.kind)[str(node.kind).index('.')+1:]
    return '{} {}'.format(kind, text)

if len(sys.argv) != 2:
    print("Usage: dump_ast.py [header file name]")
    sys.exit()

clang.cindex.Config.set_library_file('/usr/lib/llvm-3.6/lib/libclang-3.6.so')
index = clang.cindex.Index.create()
translation_unit = index.parse(sys.argv[1], ['-x', 'c++', '-std=c++11', '-D__CODE_GENERATOR__'])
print(asciitree.draw_tree(translation_unit.cursor, node_children, print_node))

Но окончательный результат этого теста выглядит следующим образом:

TRANSLATION_UNIT adlist.c
 +--FUNCTION_DECL listCreate
     +--COMPOUND_STMT 
        +--DECL_STMT 
           +--STRUCT_DECL list
           +--VAR_DECL list
              +--TYPE_REF struct list

Очевидно, что окончательный результат неверен. там много кодов не осталось не проанализировано. Я попытался пройти блок перевода, но результат так же, как показывает дерево - многие узлы пропали. Почему это так? И есть ли способ решить проблему? Спасибо!

Я предполагаю, что причина в том, что Libclang не может разобрать malloc(). потому что ни stdlib не был включен в этот код, ни пользовательское определение, предоставленное для malloc.

1 ответ

Анализ не завершился успешно, возможно, потому что вы пропустили некоторые пути включения.

Вы можете подтвердить, в чем именно заключается проблема, распечатав диагностические сообщения.

translation_unit = index.parse(sys.argv[1], args)
for diag in translation_unit.diagnostics:
    print diag
Другие вопросы по тегам