Генерация таблицы символов полного контекста из файла ELF
Я пытаюсь придумать удобный способ создания таблицы символов из моего скомпилированного двоичного файла.
Обычно я работаю со встроенным полнофункциональным набором инструментов GNU, хотя я открыт для использования системных утилит (предпочтительно Windows/MSYS2/Cygwin). Мой язык сценариев - Python, так как этот язык обычно используется в компании, в которой я работаю.
Для справки, следующий пост ~4 года назад - почти то, что я ищу, и я надеялся, что, учитывая, что прошло значительное количество времени, должен быть более простой способ добиться этого.
Я довольно знаком с GDB и привык к использованию info variables
, p &name
, ptype name
и т. д. В конечном итоге мне нужен ввод / вывод, который выглядит примерно так, как показано ниже. Мне нужно будет поддерживать все структуры, союзы, перечисления и глубокое вложение типов (структуры внутри структур внутри структур). Я в порядке, удаляя все другие декорации, такие как статические, изменчивые, атомарные и т. Д. Я пока не уверен, что я хочу сделать с указателями, но я полагаю, было бы неплохо добавить звездочку к типу в Выход CSV ниже.
Образец кода
uint64_t myU64;
int64_t my64;
typedef struct {
uint8_t aaa;
int8_t bbb;
} myStruct2_t;
struct {
uint32_t a;
int32_t b;
float c;
enum {
E_ONE = 100,
E_TWO = 200,
E_THREE = 300
} myEnum;
union {
uint16_t aa;
int16_t bb;
} myUnion;
myStruct2_t myStruct2[3];
uint32_t myArr[2];
} myStruct;
Желаемый вывод
myU64, 0x8001918, uint64_t
my64, 0x800191C, int64_t
myStruct.a, 0x8001920, uint32_t
myStruct.b, 0x8001924, int32_t
myStruct.c, 0x8001928, float
myStruct.myEnum, 0x800192C, int16_t <-- Requires deeper digging for enum
myStruct.myUnion.aa, 0x800192E, uint16_t
myStruct.myUnion.bb, 0x800192E, int16_t
myStruct.myStruct2[0].aaa, 0x8001930, uint8_t
myStruct.myStruct2[0].bbb, 0x8001931, int8_t
myStruct.myStruct2[1].aaa, 0x8001932, uint8_t
myStruct.myStruct2[1].bbb, 0x8001933, int8_t
myStruct.myStruct2[2].aaa, 0x8001934, uint8_t
myStruct.myStruct2[2].bbb, 0x8001935, int8_t
myStruct.myArr[0], 0x8001938, uint32_t
myStruct.myArr[1], 0x800193C, uint32_t
Используя примеры команд gdb, которые я перечислил выше, я могу получить всю эту информацию, но для этого потребуется написать чрезвычайно сложный анализатор строк. Есть идеи? Существующие инструменты или простой способ автоматизировать это? У меня все в порядке с созданием инструмента, но пока мои идеи требуют чудовищного разбора строк. Я кратко рассмотрел API Python / GDB, но не видел примеров, которые могут быть очень полезными, но, возможно, я тоже мог бы пойти по этому пути.
Кроме того, хотя я сосредоточился на использовании GDB, я открыт для любого другого инструмента, который может помочь.
Спасибо!
1 ответ
отличный способ создания таблицы символов из моего скомпилированного двоичного файла.
Ваш скомпилированный двоичный файл уже имеет таблицу символов, и то, что вы пытаетесь сгенерировать, не имеет ничего общего с тем, что обычно является таблицей символов, создавая ненужную путаницу.
То, что вы ищете, - это описание отладочной информации в нестандартном формате (стандартный формат - DWARF, который GDB читает для получения выходных данных. ptype
).
Чтобы программно прочитать информацию об отладке DWARF, используйте libdwarf.