Равенство с плавающей точкой
Общеизвестно, что нужно быть осторожным при сравнении значений с плавающей запятой. Обычно вместо использования ==
Мы используем некоторые тесты на равенство на основе эпсилон или ULP.
Однако, интересно, есть ли случаи при использовании ==
отлично в порядке?
Посмотрите на этот простой фрагмент, какие случаи гарантированно будут успешными?
void fn(float a, float b) {
float l1 = a/b;
float l2 = a/b;
if (l1==l1) { } // case a)
if (l1==l2) { } // case b)
if (l1==a/b) { } // case c)
if (l1==5.0f/3.0f) { } // case d)
}
int main() {
fn(5.0f, 3.0f);
}
Примечание: я проверил это и это, но они не покрывают (все) мои дела.
Примечание 2: Кажется, мне нужно добавить некоторую положительную информацию, поэтому ответы могут быть полезны на практике: я хотел бы знать:
- что говорит стандарт C++
- что произойдет, если реализация C++ будет следовать IEEE-754
Это единственное соответствующее заявление, которое я нашел в текущем проекте стандарта:
Представление значений типов с плавающей запятой определяется реализацией. [Примечание: этот документ не предъявляет никаких требований к точности операций с плавающей запятой; см. также [support.limits]. - конец примечания]
Значит ли это, что даже "case a)" определяется реализацией? Я имею в виду, l1==l1
это определенно операция с плавающей точкой. Итак, если реализация "неточная", то может l1==l1
быть ложным?
Я думаю, что этот вопрос не является дубликатом. Является ли с плавающей точкой == когда-либо нормально?, Этот вопрос не касается ни одного из случаев, которые я задаю. Та же тема, другой вопрос. Я хотел бы получить ответы конкретно для случая а)-г), для которого я не могу найти ответы в дублированном вопросе.
6 ответов
Однако, мне интересно, есть ли случаи, когда использование == прекрасно?
Конечно, есть. Одна категория примеров - это использования, которые не требуют вычислений, например, сеттеры, которые должны выполняться только при изменениях:
void setRange(float min, float max)
{
if(min == m_fMin && max == m_fMax)
return;
m_fMin = min;
m_fMax = max;
// Do something with min and/or max
emit rangeChanged(min, max);
}
См. Также Является ли с плавающей точкой == когда-либо нормально? и с плавающей точкой == когда-либо в порядке?,
Придуманные дела могут "работать". Практические случаи могут все еще потерпеть неудачу. Еще одна проблема заключается в том, что зачастую оптимизация приводит к небольшим изменениям в способе расчета, поэтому символически результаты должны быть одинаковыми, но численно они различаются. Приведенный выше пример теоретически может потерпеть неудачу в таком случае. Некоторые компиляторы предлагают возможность получения более согласованных результатов при снижении производительности. Я бы посоветовал "всегда" избегать равенства чисел с плавающей точкой.
Равенство физических измерений, а также числа, хранящиеся в цифровом виде, часто бессмысленно. Так что, если вы сравниваете, если в вашем коде числа с плавающей точкой равны, вы, вероятно, делаете что-то не так. Вы обычно хотите больше или меньше или в пределах допуска. Часто код можно переписать, чтобы избежать подобных проблем.
Только a) и b) гарантированно преуспеют в любой вменяемой реализации (подробности см. Ниже), так как они сравнивают два значения, которые были получены таким же образом и округлены до float
точность. Следовательно, оба сравниваемых значения гарантированно будут идентичны последнему биту.
Случаи c) и d) могут потерпеть неудачу, потому что вычисление и последующее сравнение могут быть выполнены с большей точностью, чем float
, Различное округление double
должно быть достаточно, чтобы провалить тест.
Обратите внимание, что случаи a) и b) могут все же потерпеть неудачу, если задействованы бесконечности или NAN.
ЮРИДИЧЕСКАЯ
Используя рабочий проект стандарта N3242 C++11, я обнаружил следующее:
В тексте, описывающем выражение присваивания, прямо указано, что происходит преобразование типов, [expr.ass] 3:
Если левый операнд не относится к типу класса, выражение неявно преобразуется (пункт 4) в cv-неквалифицированный тип левого операнда.
Раздел 4 относится к стандартным преобразованиям [conv], которые содержат следующее для преобразований с плавающей запятой, [conv.double] 1:
Значение типа с плавающей запятой может быть преобразовано в значение другого типа с плавающей запятой. Если исходное значение может быть точно представлено в типе назначения, результатом преобразования будет именно это представление. Если исходное значение находится между двумя смежными целевыми значениями, результатом преобразования является определенный реализацией выбор любого из этих значений. В противном случае поведение не определено.
(Акцент мой.)
Таким образом, у нас есть гарантия того, что результат преобразования фактически определен, если только мы не имеем дело со значениями за пределами представимого диапазона (например, float a = 1e300
, который является UB).
Когда люди думают о том, что "внутреннее представление с плавающей точкой может быть более точным, чем видимое в коде", они думают о следующем предложении в стандарте, [expr] 11:
Значения плавающих операндов и результаты плавающих выражений могут быть представлены с большей точностью и диапазоном, чем требуется типом; типы не изменяются при этом.
Обратите внимание, что это относится к операндам и результатам, а не к переменным. Это подчеркивается прилагаемой сноской 60:
Операторы приведения и присваивания по-прежнему должны выполнять свои конкретные преобразования, как описано в 5.4, 5.2.9 и 5.17.
(Думаю, это сноска, которую Мачей Пехотка имел в виду в комментариях - нумерация, похоже, изменилась в версии стандарта, которую он использовал.)
Итак, когда я говорю float a = some_double_expression;
У меня есть гарантия, что результат выражения на самом деле округляется, чтобы быть представленным float
(вызывая UB, только если значение выходит за пределы), и a
будет ссылаться на это округленное значение впоследствии.
Реализация может действительно указывать, что результат округления является случайным, и, таким образом, разбивать случаи a) и b). Тем не менее, разумные реализации этого не сделают.
Случай (а) терпит неудачу, если a == b == 0.0
, В этом случае операция дает NaN, и по определению (IEEE, а не C) NaN ≠ NaN.
Случаи (b) и (c) могут давать сбой при параллельном вычислении, когда режимы с плавающей запятой (или другие режимы вычислений) изменяются в середине выполнения этого потока. Видел это на практике, к сожалению.
Случай (d) может отличаться, потому что компилятор (на некоторой машине) может выбрать постоянное свертывание вычисления 5.0f/3.0f
и заменить его постоянным результатом (с неопределенной точностью), тогда как a/b
должен быть вычислен во время выполнения на целевой машине (которая может радикально отличаться). Фактически промежуточные вычисления могут выполняться с произвольной точностью. Я видел различия в старых архитектурах Intel, когда промежуточные вычисления выполнялись в 80-битном формате с плавающей запятой, формате, который язык даже не поддерживал напрямую.
Предполагая семантику IEEE 754, в некоторых случаях вы можете сделать это. Обычные вычисления с плавающей запятой являются точными, где бы они ни были, что, например, включает (но не ограничивается ими) все основные операции, где операнды и результаты являются целыми числами.
Поэтому, если вы точно знаете, что не делаете ничего, что могло бы привести к непредставлению чего-либо, у вас все в порядке. Например
float a = 1.0f;
float b = 1.0f;
float c = 2.0f;
assert(a + b == c); // you can safely expect this to succeed
Ситуация действительно ухудшается только в том случае, если у вас есть вычисления с не совсем точными результатами (или с точными операциями), и вы меняете порядок операций.
Обратите внимание, что сам стандарт C++ не гарантирует семантику IEEE 754, но с этим вы можете ожидать большую часть времени.
По моему скромному мнению, вы не должны полагаться на ==
оператор, потому что у него много угловых случаев. Самая большая проблема - округление и повышенная точность. В случае x86, операции с плавающей точкой могут выполняться с большей точностью, чем вы можете хранить в переменных (если вы используете сопроцессоры, операции IIRC SSE используют ту же точность, что и хранилище).
Обычно это хорошо, но это вызывает такие проблемы, как:1./2 != 1./2
потому что одно значение является переменной формы, а второе - из регистра с плавающей запятой. В простейших случаях это будет работать, но если вы добавите другие операции с плавающей запятой, компилятор может решить разделить некоторые переменные в стеке, изменив их значения, тем самым изменив результат сравнения.
Чтобы иметь 100% уверенность, вам нужно взглянуть на сборку и посмотреть, какие операции были выполнены ранее для обоих значений. Даже порядок может изменить результат в нетривиальных случаях.
В целом, какой смысл использовать ==
? Вы должны использовать алгоритмы, которые являются стабильными. Это означает, что они работают, даже если значения не равны, но они все равно дают те же результаты. Единственное место, где я знаю, где ==
может быть полезно сериализацию / десериализацию, когда вы точно знаете, какой результат вы хотите получить, и вы можете изменить сериализацию для архивирования вашей цели.