Генерация таблицы символов полного контекста из файла ELF

Я пытаюсь придумать удобный способ создания таблицы символов из моего скомпилированного двоичного файла.

Обычно я работаю со встроенным полнофункциональным набором инструментов GNU, хотя я открыт для использования системных утилит (предпочтительно Windows/MSYS2/Cygwin). Мой язык сценариев - Python, так как этот язык обычно используется в компании, в которой я работаю.

Для справки, следующий пост ~4 года назад - почти то, что я ищу, и я надеялся, что, учитывая, что прошло значительное количество времени, должен быть более простой способ добиться этого.

Извлечение подробной символьной информации (членов структуры) из файла elf, скомпилированного с ARM-GCC

Я довольно знаком с GDB и привык к использованию info variables, p &name, ptype nameи т. д. В конечном итоге мне нужен ввод / вывод, который выглядит примерно так, как показано ниже. Мне нужно будет поддерживать все структуры, союзы, перечисления и глубокое вложение типов (структуры внутри структур внутри структур). Я в порядке, удаляя все другие декорации, такие как статические, изменчивые, атомарные и т. Д. Я пока не уверен, что я хочу сделать с указателями, но я полагаю, было бы неплохо добавить звездочку к типу в Выход CSV ниже.

Образец кода

uint64_t myU64;
int64_t my64;

typedef struct {
    uint8_t aaa;
    int8_t bbb;
} myStruct2_t;

struct {
    uint32_t a;
    int32_t b;
    float c;
    enum {
        E_ONE = 100,
        E_TWO = 200,
        E_THREE = 300
    } myEnum;
    union {
        uint16_t aa;
        int16_t bb;
    } myUnion;
    myStruct2_t myStruct2[3];
    uint32_t myArr[2];
} myStruct;

Желаемый вывод

myU64, 0x8001918, uint64_t
my64, 0x800191C, int64_t
myStruct.a, 0x8001920, uint32_t
myStruct.b, 0x8001924, int32_t
myStruct.c, 0x8001928, float
myStruct.myEnum, 0x800192C, int16_t <-- Requires deeper digging for enum
myStruct.myUnion.aa, 0x800192E, uint16_t
myStruct.myUnion.bb, 0x800192E, int16_t
myStruct.myStruct2[0].aaa, 0x8001930, uint8_t
myStruct.myStruct2[0].bbb, 0x8001931, int8_t
myStruct.myStruct2[1].aaa, 0x8001932, uint8_t
myStruct.myStruct2[1].bbb, 0x8001933, int8_t
myStruct.myStruct2[2].aaa, 0x8001934, uint8_t
myStruct.myStruct2[2].bbb, 0x8001935, int8_t
myStruct.myArr[0], 0x8001938, uint32_t
myStruct.myArr[1], 0x800193C, uint32_t

Используя примеры команд gdb, которые я перечислил выше, я могу получить всю эту информацию, но для этого потребуется написать чрезвычайно сложный анализатор строк. Есть идеи? Существующие инструменты или простой способ автоматизировать это? У меня все в порядке с созданием инструмента, но пока мои идеи требуют чудовищного разбора строк. Я кратко рассмотрел API Python / GDB, но не видел примеров, которые могут быть очень полезными, но, возможно, я тоже мог бы пойти по этому пути.

Кроме того, хотя я сосредоточился на использовании GDB, я открыт для любого другого инструмента, который может помочь.

Спасибо!

1 ответ

Решение

отличный способ создания таблицы символов из моего скомпилированного двоичного файла.

Ваш скомпилированный двоичный файл уже имеет таблицу символов, и то, что вы пытаетесь сгенерировать, не имеет ничего общего с тем, что обычно является таблицей символов, создавая ненужную путаницу.

То, что вы ищете, - это описание отладочной информации в нестандартном формате (стандартный формат - DWARF, который GDB читает для получения выходных данных. ptype).

Чтобы программно прочитать информацию об отладке DWARF, используйте libdwarf.

Другие вопросы по тегам