Каково состояние регистра по умолчанию при запуске программы (asm, linux)?

Когда запускается программа (linux, elf) - есть ли нули в eax, ebxи т.д. или что-то может быть (я не делаю никаких звонков или не использую внешние библиотеки)? На моей машине это действительно так, могу ли я передать такое поведение при написании программ asm?

3 ответа

Решение

Это полностью зависит от ABI для каждой платформы. Поскольку вы упоминаете eax а также ebx давайте посмотрим, что происходит с x86. В fs/binfmt_elf.c линия № 972, внутри load_elf_binary()ядро проверяет, определяет ли ABI какие-либо требования к значениям регистра при загрузке программы:

/*
 * The ABI may specify that certain registers be set up in special
 * ways (on i386 %edx is the address of a DT_FINI function, for
 * example.  In addition, it may also specify (eg, PowerPC64 ELF)
 * that the e_entry field is the address of the function descriptor
 * for the startup routine, rather than the address of the startup
 * routine itself.  This macro performs whatever initialization to
 * the regs structure is required as well as any relocations to the
 * function descriptor entries when executing dynamically links apps.
 */

Затем звонит ELF_PLAT_INIT, который является макросом, определенным для каждой архитектуры в arch/xxx/include/elf.h, Для x86 это делает следующее:

#define ELF_PLAT_INIT(_r, load_addr)        \
    do {                                    \
        _r->bx = 0; _r->cx = 0; _r->dx = 0; \
        _r->si = 0; _r->di = 0; _r->bp = 0; \
        _r->ax = 0;                         \
    } while (0)

Таким образом, когда ваш двоичный файл ELF загружается в Linux x86, вы можете рассчитывать на то, что все значения регистров равны нулю. Это не значит, что ты должен.:-)

Для систем AMD64 или x86-64 (64 бита) в Linux ABI x86-64 определяет начальное содержимое регистров.

Есть аналогичные спецификации для i386 ABI, ARM ABI и т. Д.

Смотрите страницы википедии на ELF и ABI

x86-64 System V ABI раздел 3.4.1 "Начальное состояние стека и регистра" ( Базилик связан с PDF):

  1. %rsp указывает на стека

    Указатель стека содержит адрес байта с наименьшим адресом, который является частью стека. Он гарантированно выровнен по 16 байтов при входе в процесс

  2. %rdx указатель на функцию, которую приложение должно зарегистрировать в atexit, если оно не равно нулю.

    указатель на функцию, которую приложение должно зарегистрировать

  3. %rbp не определено, но пользовательская область должна установить его в базовый фрейм.

    Содержимое этого регистра не определено во время инициализации процесса, но пользовательский код должен пометить самый глубокий кадр стека, установив указатель кадра в ноль.

  4. Все остальное не определено.

Затем Linux следует этому "потому что" LSB говорит так.

Другие вопросы по тегам