Почему функции, использующие std::mutex, выполняют нулевую проверку адреса pthread_key_create?

Возьмем эту простую функцию, которая увеличивает целое число под блокировкой, реализованной std::mutex:

#include <mutex>

std::mutex m;

void inc(int& i) {
    std::unique_lock<std::mutex> lock(m);
    i++;
}

Я ожидал бы, что это (после встраивания) скомпилируется прямым способом к вызову m.lock() приращение i а потом m.unlock(),

Проверка сгенерированной сборки на наличие последних версий gcc а также clangОднако мы видим дополнительное осложнение. Принимая gcc версия первая:

inc(int&):
  mov eax, OFFSET FLAT:__gthrw___pthread_key_create(unsigned int*, void (*)(void*))
  test rax, rax
  je .L2
  push rbx
  mov rbx, rdi
  mov edi, OFFSET FLAT:m
  call __gthrw_pthread_mutex_lock(pthread_mutex_t*)
  test eax, eax
  jne .L10
  add DWORD PTR [rbx], 1
  mov edi, OFFSET FLAT:m
  pop rbx
  jmp __gthrw_pthread_mutex_unlock(pthread_mutex_t*)
.L2:
  add DWORD PTR [rdi], 1
  ret
.L10:
  mov edi, eax
  call std::__throw_system_error(int)

Это первые пару строк, которые интересны. Собранный код проверяет адрес __gthrw___pthread_key_create (который является реализацией для pthread_key_create - функция для создания локального ключа потока), и если он равен нулю, он переходит к .L2 который реализует приращение в одной инструкции без какой-либо блокировки вообще.

Если он не равен нулю, он работает так, как ожидалось: блокирует мьютекс, делает приращение и разблокирует.

clang делает еще больше: проверяет адрес функции дважды, один раз перед lock и однажды перед unlock:

inc(int&): # @inc(int&)
  push rbx
  mov rbx, rdi
  mov eax, __pthread_key_create
  test rax, rax
  je .LBB0_4
  mov edi, m
  call pthread_mutex_lock
  test eax, eax
  jne .LBB0_6
  inc dword ptr [rbx]
  mov eax, __pthread_key_create
  test rax, rax
  je .LBB0_5
  mov edi, m
  pop rbx
  jmp pthread_mutex_unlock # TAILCALL
.LBB0_4:
  inc dword ptr [rbx]
.LBB0_5:
  pop rbx
  ret
.LBB0_6:
  mov edi, eax
  call std::__throw_system_error(int)

Какова цель этой проверки?

Возможно, это для поддержки случая, когда объектный файл в конечном итоге скомпилирован в двоичный файл без поддержки pthreads, а затем для возврата к версии без блокировки в этом случае? Я не смог найти никакой документации по этому поведению.

1 ответ

Решение

Ваше предположение выглядит правильным. От libgcc/gthr-posix.h файл в исходном хранилище gcc ( https://github.com/gcc-mirror/gcc.git):

/* For a program to be multi-threaded the only thing that it certainly must
   be using is pthread_create.  However, there may be other libraries that
   intercept pthread_create with their own definitions to wrap pthreads
   functionality for some purpose.  In those cases, pthread_create being
   defined might not necessarily mean that libpthread is actually linked
   in.

   For the GNU C library, we can use a known internal name.  This is always
   available in the ABI, but no other library would define it.  That is
   ideal, since any public pthread function might be intercepted just as
   pthread_create might be.  __pthread_key_create is an "internal"
   implementation symbol, but it is part of the public exported ABI.  Also,
   it's among the symbols that the static libpthread.a always links in
   whenever pthread_create is used, so there is no danger of a false
   negative result in any statically-linked, multi-threaded program.

   For others, we choose pthread_cancel as a function that seems unlikely
   to be redefined by an interceptor library.  The bionic (Android) C
   library does not provide pthread_cancel, so we do use pthread_create
   there (and interceptor libraries lose).  */

#ifdef __GLIBC__
__gthrw2(__gthrw_(__pthread_key_create),
     __pthread_key_create,
     pthread_key_create)
# define GTHR_ACTIVE_PROXY  __gthrw_(__pthread_key_create)
#elif defined (__BIONIC__)
# define GTHR_ACTIVE_PROXY  __gthrw_(pthread_create)
#else
# define GTHR_ACTIVE_PROXY  __gthrw_(pthread_cancel)
#endif

static inline int
__gthread_active_p (void)
{
  static void *const __gthread_active_ptr
    = __extension__ (void *) &GTHR_ACTIVE_PROXY;
  return __gthread_active_ptr != 0;
}

Затем на протяжении оставшейся части файла многие из API-интерфейсов pthread помещаются внутри проверок в __gthread_active_p() функция. Если __gthread_active_p() возвращает 0, ничего не сделано, и успех возвращается.

Другие вопросы по тегам