Плавающие биты и строгое наложение

Я пытаюсь извлечь биты из числа с плавающей точкой, не вызывая неопределенного поведения. Вот моя первая попытка:

unsigned foo(float x)
{
    unsigned* u = (unsigned*)&x;
    return *u;
}

Насколько я понимаю, это не гарантирует работу из-за строгих правил наложения имен, верно? Работает ли это, если сделать промежуточный шаг с символьным указателем?

unsigned bar(float x)
{
    char* c = (char*)&x;
    unsigned* u = (unsigned*)c;
    return *u;
}

Или я должен сам извлечь отдельные байты?

unsigned baz(float x)
{
    unsigned char* c = (unsigned char*)&x;
    return c[0] | c[1] << 8 | c[2] << 16 | c[3] << 24;
}

Конечно, у этого есть недостаток зависимости от порядка байтов, но я мог бы жить с этим.

Профсоюзный хак - это определенно неопределенное поведение, верно?

unsigned uni(float x)
{
    union { float f; unsigned u; };
    f = x;
    return u;
}

Просто для полноты вот справочная версия foo, Также неопределенное поведение, верно?

unsigned ref(float x)
{
    return (unsigned&)x;
}

Итак, возможно ли извлечь биты из числа с плавающей запятой (если, конечно, оба имеют ширину 32 бита)?


РЕДАКТИРОВАТЬ: И вот memcpy версия, предложенная Гозом. Поскольку многие компиляторы не поддерживают static_assert все же я заменил static_assert с некоторым шаблоном метапрограммирования:

template <bool, typename T>
struct requirement;

template <typename T>
struct requirement<true, T>
{
    typedef T type;
};

unsigned bits(float x)
{
    requirement<sizeof(unsigned)==sizeof(float), unsigned>::type u;
    memcpy(&u, &x, sizeof u);
    return u;
}

4 ответа

Решение

Единственный способ действительно избежать любых проблем - это memcpy.

unsigned int FloatToInt( float f )
{
   static_assert( sizeof( float ) == sizeof( unsigned int ), "Sizes must match" );
   unsigned int ret;
   memcpy( &ret, &f, sizeof( float ) );
   return ret;
}

Поскольку вы запоминаете фиксированное количество, компилятор оптимизирует его.

При этом метод объединения ОЧЕНЬ широко поддерживается.

Профсоюзный хак - это определенно неопределенное поведение, верно?

И да и нет. Согласно стандарту, это определенно неопределенное поведение. Но это такой распространенный трюк, что GCC и MSVC, а также, насколько я знаю, любой другой популярный компилятор, явно гарантируют, что он безопасен и будет работать так, как ожидается.

Следующее не нарушает правило псевдонимов, потому что оно не использует lvalues ​​для доступа к различным типам где-либо

template<typename B, typename A>
B noalias_cast(A a) { 
  union N { 
    A a; 
    B b; 
    N(A a):a(a) { }
  };
  return N(a).b;
}

unsigned bar(float x) {
  return noalias_cast<unsigned>(x);
}

Если вы действительно хотите быть независимыми от размера типа float и просто возвращать необработанные биты, сделайте что-то вроде этого:

void float_to_bytes(char *buffer, float f) {
    union {
        float x;
        char b[sizeof(float)];
    };

    x = f;
    memcpy(buffer, b, sizeof(float));
}

Тогда назовите это так:

float a = 12345.6789;
char buffer[sizeof(float)];

float_to_bytes(buffer, a);

Этот метод, конечно, будет производить вывод, специфичный для порядка следования байтов вашей машины.

Другие вопросы по тегам