Плавающие биты и строгое наложение
Я пытаюсь извлечь биты из числа с плавающей точкой, не вызывая неопределенного поведения. Вот моя первая попытка:
unsigned foo(float x)
{
unsigned* u = (unsigned*)&x;
return *u;
}
Насколько я понимаю, это не гарантирует работу из-за строгих правил наложения имен, верно? Работает ли это, если сделать промежуточный шаг с символьным указателем?
unsigned bar(float x)
{
char* c = (char*)&x;
unsigned* u = (unsigned*)c;
return *u;
}
Или я должен сам извлечь отдельные байты?
unsigned baz(float x)
{
unsigned char* c = (unsigned char*)&x;
return c[0] | c[1] << 8 | c[2] << 16 | c[3] << 24;
}
Конечно, у этого есть недостаток зависимости от порядка байтов, но я мог бы жить с этим.
Профсоюзный хак - это определенно неопределенное поведение, верно?
unsigned uni(float x)
{
union { float f; unsigned u; };
f = x;
return u;
}
Просто для полноты вот справочная версия foo
, Также неопределенное поведение, верно?
unsigned ref(float x)
{
return (unsigned&)x;
}
Итак, возможно ли извлечь биты из числа с плавающей запятой (если, конечно, оба имеют ширину 32 бита)?
РЕДАКТИРОВАТЬ: И вот memcpy
версия, предложенная Гозом. Поскольку многие компиляторы не поддерживают static_assert
все же я заменил static_assert
с некоторым шаблоном метапрограммирования:
template <bool, typename T>
struct requirement;
template <typename T>
struct requirement<true, T>
{
typedef T type;
};
unsigned bits(float x)
{
requirement<sizeof(unsigned)==sizeof(float), unsigned>::type u;
memcpy(&u, &x, sizeof u);
return u;
}
4 ответа
Единственный способ действительно избежать любых проблем - это memcpy.
unsigned int FloatToInt( float f )
{
static_assert( sizeof( float ) == sizeof( unsigned int ), "Sizes must match" );
unsigned int ret;
memcpy( &ret, &f, sizeof( float ) );
return ret;
}
Поскольку вы запоминаете фиксированное количество, компилятор оптимизирует его.
При этом метод объединения ОЧЕНЬ широко поддерживается.
Профсоюзный хак - это определенно неопределенное поведение, верно?
И да и нет. Согласно стандарту, это определенно неопределенное поведение. Но это такой распространенный трюк, что GCC и MSVC, а также, насколько я знаю, любой другой популярный компилятор, явно гарантируют, что он безопасен и будет работать так, как ожидается.
Следующее не нарушает правило псевдонимов, потому что оно не использует lvalues для доступа к различным типам где-либо
template<typename B, typename A>
B noalias_cast(A a) {
union N {
A a;
B b;
N(A a):a(a) { }
};
return N(a).b;
}
unsigned bar(float x) {
return noalias_cast<unsigned>(x);
}
Если вы действительно хотите быть независимыми от размера типа float и просто возвращать необработанные биты, сделайте что-то вроде этого:
void float_to_bytes(char *buffer, float f) {
union {
float x;
char b[sizeof(float)];
};
x = f;
memcpy(buffer, b, sizeof(float));
}
Тогда назовите это так:
float a = 12345.6789;
char buffer[sizeof(float)];
float_to_bytes(buffer, a);
Этот метод, конечно, будет производить вывод, специфичный для порядка следования байтов вашей машины.