Код уровня сборки корпуса переключателя

Я программирую C на окнах Cygwin. После того, как я немного освоился с программированием на C и освоился с языком, я хотел заглянуть под капот и посмотреть, что делает компилятор для кода, который я пишу.

Поэтому я записал блок кода, содержащий операторы регистра переключателей, и преобразовал их в сборку, используя:

gcc -S foo.c  

Вот источник C:

switch(i)
{
    case 1:
    {
        printf("Case 1\n");
        break;
    }
    case 2:
    {           printf("Case 2\n");
        break;
    }
    case 3:
    {
        printf("Case 3\n");
        break;
    }
    case 4:
    {
        printf("Case 4\n");
        break;
    }
    case 5:
    {
        printf("Case 5\n");
        break;
    }
    case 6:
    {
        printf("Case 6\n");
        break;
    }
    case 7:
    {
        printf("Case 7\n");
        break;
    }
    case 8:
    {
        printf("Case 8\n");
        break;
    }
    case 9:
    {
        printf("Case 9\n");
        break;
    }
    case 10:
    {
        printf("Case 10\n");
        break;
    }
    default:
    {
        printf("Nothing\n");
        break;
    }
}  

Теперь результирующая сборка для того же:

movl    $5, -4(%ebp)
cmpl    $10, -4(%ebp)
ja  L13
movl    -4(%ebp), %eax
sall    $2, %eax
movl    L14(%eax), %eax
jmp *%eax
.section .rdata,"dr"
.align 4
L14:
.long   L13
.long   L3
.long   L4
.long   L5
.long   L6
.long   L7
.long   L8
.long   L9
.long   L10
.long   L11
.long   L12
.text
L3:
movl    $LC0, (%esp)
call    _printf
jmp L2
L4:
movl    $LC1, (%esp)
call    _printf
jmp L2
L5:
movl    $LC2, (%esp)
call    _printf
jmp L2
L6:
movl    $LC3, (%esp)
call    _printf
jmp L2
L7:
movl    $LC4, (%esp)
call    _printf
jmp L2
L8:
movl    $LC5, (%esp)
call    _printf
jmp L2
L9:
movl    $LC6, (%esp)
call    _printf
jmp L2
L10:
movl    $LC7, (%esp)
call    _printf
jmp L2
L11:
movl    $LC8, (%esp)
call    _printf
jmp L2
L12:
movl    $LC9, (%esp)
call    _printf
jmp L2
L13:
movl    $LC10, (%esp)
call    _printf
L2:  

Теперь в сборке код сначала проверяет последний случай (т.е. случай 10). Это очень странно И затем он копирует "я" в "eax" и делает то, что мне не под силу.

Я слышал, что компилятор реализует некоторую таблицу переходов для switch..case. Это то, что делает этот код? Или что он делает и почему? Потому что в случае меньшего количества случаев код очень похож на код, сгенерированный для if... else лестница, но когда число случаев увеличивается, эта необычно выглядящая реализация видна.

Заранее спасибо.

4 ответа

Решение

Сначала код сравнивает i с 10 и переходит к случаю по умолчанию, когда значение больше 10 (cmpl $10, -4(%ebp) с последующим ja L13).

Следующий бит кода смещает ввод влево на два (sall $2, %eax) то же самое, что и умножение на четыре, которое генерирует смещение в таблице переходов (поскольку каждая запись в таблице имеет длину 4 байта)

Затем он загружает адрес из таблицы переходов (movl L14(%eax), %eax) и прыгает на него (jmp *%eax).

Таблица переходов - это просто список адресов (представленных в коде сборки метками):

L14:
.long   L13
.long   L3
.long   L4
...

Стоит отметить, что L13 представляет случай по умолчанию. Это первая запись в таблице переходов (для случаев, когда i равно 0), и она обрабатывается специально в начале (когда i > 10).

Да, это таблица прыжков. Первая проверка состоит в том, чтобы проверить, находится ли значение в случаях, и перейти к значению по умолчанию, если это не так. Не забывайте, что в такой таблице, если%eax равно 0, L14(%eax) указывает на первый элемент таблицы (L13). Итак, в таблице case 10: индексируется 9, а не 10.

Способ переключения зависит от значений, которые вы имеете в case; в этом случае они находятся в "последовательности", поэтому возможна простая таблица переходов.

За [1..10] компилятор сгенерирует таблицу, так что ему не нужно сравнивать значение, чтобы пойти куда-то, он непосредственно делает: goto table[i], Так быстрее.

Но в случае i > 10 он переходит к вашей инструкции по умолчанию. Прежде чем прыгать, необходимо сначала проверить, что программа с треском провалилась.

Если бы у вас были разреженные значения (например, 23, 9233, 91238, а не 1, 2, 3...), компилятор не генерировал бы такую ​​таблицу и сравнивал бы каждое значение.

Да, первый eax рассчитывается по значению переключателя (sall сдвиг как умножение), чтобы получить адрес из таблицы переходов (следующий ярлык L14:)

jmp *%eax это быстрый переход к ярлыку вашего дела. (JMP возле Eax)

Код, следующий за другими метками, просто печатает и пропускает другие случаи.

Другие вопросы по тегам