Является ли эта реализация C++ для атомного плавающего безопасна?

Изменить: В этом коде все еще есть некоторые ошибки, и он может работать лучше в отделе производительности, но вместо того, чтобы попытаться это исправить, для справки, я передал проблему в дискуссионные группы Intel и получил много хороших отзывов, и если все пойдет хорошо, отполированная версия Atomic float будет включена в ближайший выпуск Intel Threading Building Blocks.

Хорошо, вот сложный вопрос, я хочу плавание Atomic, не для сверхбыстрой графической производительности, а для регулярного использования в качестве членов данных классов. И я не хочу платить цену за использование замков в этих классах, потому что это не дает никаких дополнительных преимуществ для моих нужд.

Теперь с Intel TBB и другими атомарными библиотеками, которые я видел, поддерживаются целочисленные типы, но не с плавающей точкой. Поэтому я продолжил и реализовал один, и он работает... но я не уверен, действительно ли он работает, или мне просто очень повезло, что он работает.

Кто-нибудь здесь знает, если это не какая-то форма ереси потоков?

typedef unsigned int uint_32;

  struct AtomicFloat
    tbb::atomic<uint_32> atomic_value_;

    template<memory_semantics M>
    float fetch_and_store( float value ) 
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::fetch_and_store<M>((uint_32&)value);
        return reinterpret_cast<const float&>(value_);

    float fetch_and_store( float value ) 
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::fetch_and_store((uint_32&)value);
        return reinterpret_cast<const float&>(value_);

    template<memory_semantics M>
    float compare_and_swap( float value, float comparand ) 
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::compare_and_swap<M>((uint_32&)value,(uint_32&)compare);
        return reinterpret_cast<const float&>(value_);

    float compare_and_swap(float value, float compare)
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::compare_and_swap((uint_32&)value,(uint_32&)compare);
        return reinterpret_cast<const float&>(value_);

    operator float() const volatile // volatile qualifier here for backwards compatibility 
        const uint_32 value_ = atomic_value_;
        return reinterpret_cast<const float&>(value_);

    float operator=(float value)
        const uint_32 value_ = atomic_value_.tbb::atomic<uint_32>::operator =((uint_32&)value);
        return reinterpret_cast<const float&>(value_);

    float operator+=(float value)
        volatile float old_value_, new_value_;
            old_value_ = reinterpret_cast<float&>(atomic_value_);
            new_value_ = old_value_ + value;
        } while(compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_);

    float operator*=(float value)
        volatile float old_value_, new_value_;
            old_value_ = reinterpret_cast<float&>(atomic_value_);
            new_value_ = old_value_ * value;
        } while(compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_);

    float operator/=(float value)
        volatile float old_value_, new_value_;
            old_value_ = reinterpret_cast<float&>(atomic_value_);
            new_value_ = old_value_ / value;
        } while(compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_);

    float operator-=(float value)
        return this->operator+=(-value);

    float operator++() 
        return this->operator+=(1);

    float operator--() 
        return this->operator+=(-1);

    float fetch_and_add( float addend ) 
        return this->operator+=(-addend);

    float fetch_and_increment() 
        return this->operator+=(1);

    float fetch_and_decrement() 
        return this->operator+=(-1);


Изменить: изменил size_t на uint32_t, как предложил Грег Роджерс, таким образом, он более переносим

Редактировать: добавлен список для всей вещи, с некоторыми исправлениями.

Дополнительные правки: с точки зрения производительности использование заблокированного числа с плавающей запятой для 5.000.000 += операций с 100 потоками на моей машине занимает 3,6 с, в то время как мой атомарный метод с плавающей запятой занимает 0,2 с, чтобы выполнить ту же работу. Таким образом, повышение производительности>30x означает, что оно того стоит (и это главное), если оно правильное.

Еще больше правок : как указал Авн мой fetch_and_xxxx части были все не так. Исправлено это и удалены части API, в которых я не уверен (шаблонные модели памяти). И реализовал другие операции с точки зрения оператора + =, чтобы избежать повторения кода

Добавлено: добавлены оператор *= и оператор /=, так как без них плавающие числа не были бы плавающими. Благодаря комментарию Петерчен, что это было замечено

Редактировать: следует последняя версия кода (хотя я оставлю старую версию для справки)

  #include <tbb/atomic.h>
  typedef unsigned int      uint_32;
  typedef __TBB_LONG_LONG       uint_64;

  template<typename FLOATING_POINT,typename MEMORY_BLOCK>
  struct atomic_float_
    /*  CRC Card -----------------------------------------------------
    |   Class:          atmomic float template class
    |   Responsability: handle integral atomic memory as it were a float,
    |                   but partially bypassing FPU, SSE/MMX, so it is
    |                   slower than a true float, but faster and smaller
    |                   than a locked float.
    |                       *Warning* If your float usage is thwarted by
    |                   the A-B-A problem this class isn't for you
    |                       *Warning* Atomic specification says we return,
    |                   values not l-values. So  (i = j) = k doesn't work.
    |   Collaborators:  intel's tbb::atomic handles memory atomicity
    typedef typename atomic_float_<FLOATING_POINT,MEMORY_BLOCK> self_t;

    tbb::atomic<MEMORY_BLOCK> atomic_value_;

    template<memory_semantics M>
    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    template<memory_semantics M>
    FLOATING_POINT compare_and_swap( FLOATING_POINT value, FLOATING_POINT comparand ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT compare_and_swap(FLOATING_POINT value, FLOATING_POINT compare)
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    operator FLOATING_POINT() const volatile // volatile qualifier here for backwards compatibility 
        const MEMORY_BLOCK value_ = atomic_value_;
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return the a copy of the base value not an l-value
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return an l-value when operating among atomics
    self_t& operator=(self_t& rhs) 
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return *this;

    FLOATING_POINT& _internal_reference() const
        return reinterpret_cast<FLOATING_POINT&>(atomic_value_.tbb::atomic<MEMORY_BLOCK>::_internal_reference());

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ + value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ * value;
        //floating point binary representation is not an issue becaus
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ / value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        return this->operator+=(-value); //return resulting value

    //Prefix operator
    FLOATING_POINT operator++()
        return this->operator+=(1); //return resulting value

    //Prefix operator
    FLOATING_POINT operator--() 
        return this->operator+=(-1); //return resulting value

    //Postfix operator
    FLOATING_POINT operator++(int)
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    //Postfix operator
    FLOATING_POINT operator--(int) 
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    FLOATING_POINT fetch_and_add( FLOATING_POINT addend ) 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_increment() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_decrement() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

  typedef atomic_float_<float,uint_32> AtomicFloat;
  typedef atomic_float_<double,uint_64> AtomicDouble;

Я бы серьезно посоветовал против публичного наследства. Я не знаю, на что похожа атомарная реализация, но я предполагаю, что в ней есть перегруженные операторы, которые используют ее в качестве целочисленного типа, что означает, что эти промоакции будут использоваться вместо вашего float во многих (может быть, в большинстве?) Случаях.

Я не вижу причин, почему это не сработает, но, как и вам, я должен доказать это...

Одно примечание: ваш operator float() подпрограмма не имеет семантики получения нагрузки, и не должна ли она быть помечена как const volatile (или определенно, по крайней мере, const)?

РЕДАКТИРОВАТЬ: Если вы собираетесь предоставить оператор -(), вы должны предоставить обе формы префикса / постфикса.

Похоже, ваша реализация предполагает, что sizeof(size_t) == sizeof(float), Это всегда будет верно для ваших целевых платформ?

И я бы не сказал, что ересь нить так сильно, как ересь.:)

Это состояние кода в том виде, в каком оно существует сейчас после переговоров на платах Intel, но до сих пор не было тщательно проверено на корректную работу во всех сценариях.

  #include <tbb/atomic.h>
  typedef unsigned int      uint_32;
  typedef __TBB_LONG_LONG       uint_64;

  template<typename FLOATING_POINT,typename MEMORY_BLOCK>
  struct atomic_float_
    /*  CRC Card -----------------------------------------------------
    |   Class:          atmomic float template class
    |   Responsability: handle integral atomic memory as it were a float,
    |                   but partially bypassing FPU, SSE/MMX, so it is
    |                   slower than a true float, but faster and smaller
    |                   than a locked float.
    |                       *Warning* If your float usage is thwarted by
    |                   the A-B-A problem this class isn't for you
    |                       *Warning* Atomic specification says we return,
    |                   values not l-values. So  (i = j) = k doesn't work.
    |   Collaborators:  intel's tbb::atomic handles memory atomicity
    typedef typename atomic_float_<FLOATING_POINT,MEMORY_BLOCK> self_t;

    tbb::atomic<MEMORY_BLOCK> atomic_value_;

    template<memory_semantics M>
    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT fetch_and_store( FLOATING_POINT value ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    template<memory_semantics M>
    FLOATING_POINT compare_and_swap( FLOATING_POINT value, FLOATING_POINT comparand ) 
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    FLOATING_POINT compare_and_swap(FLOATING_POINT value, FLOATING_POINT compare)
        const MEMORY_BLOCK value_ = 
        //atomic specification requires returning old value, not new one
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    operator FLOATING_POINT() const volatile // volatile qualifier here for backwards compatibility 
        const MEMORY_BLOCK value_ = atomic_value_;
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return the a copy of the base value not an l-value
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return reinterpret_cast<const FLOATING_POINT&>(value_);

    //Note: atomic specification says we return an l-value when operating among atomics
    self_t& operator=(self_t& rhs) 
        const MEMORY_BLOCK value_ = atomic_value_.tbb::atomic<MEMORY_BLOCK>::operator =((MEMORY_BLOCK&)rhs);
        return *this;

    FLOATING_POINT& _internal_reference() const
        return reinterpret_cast<FLOATING_POINT&>(atomic_value_.tbb::atomic<MEMORY_BLOCK>::_internal_reference());

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ + value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ * value;
        //floating point binary representation is not an issue becaus
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        FLOATING_POINT old_value_, new_value_;
            old_value_ = reinterpret_cast<FLOATING_POINT&>(atomic_value_);
            new_value_ = old_value_ / value;
        //floating point binary representation is not an issue because
        //we are using our self's compare and swap, thus comparing floats and floats
        } while(self_t::compare_and_swap(new_value_,old_value_) != old_value_);
        return (new_value_); //return resulting value

        return this->operator+=(-value); //return resulting value

    //Prefix operator
    FLOATING_POINT operator++()
        return this->operator+=(1); //return resulting value

    //Prefix operator
    FLOATING_POINT operator--() 
        return this->operator+=(-1); //return resulting value

    //Postfix operator
    FLOATING_POINT operator++(int)
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    //Postfix operator
    FLOATING_POINT operator--(int) 
        const FLOATING_POINT temp = this;
        return temp//return resulting value

    FLOATING_POINT fetch_and_add( FLOATING_POINT addend ) 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_increment() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

    FLOATING_POINT fetch_and_decrement() 
        const FLOATING_POINT old_value_ = atomic_value_;
        //atomic specification requires returning old value, not new one as in operator x=
        return old_value_; 

  typedef atomic_float_<float,uint_32> AtomicFloat;
  typedef atomic_float_<double,uint_64> AtomicDouble;

Просто примечание по этому поводу (я хотел сделать комментарий, но, очевидно, новым пользователям запрещено комментировать): Использование reinterpret_cast для ссылок приводит к некорректному коду с gcc 4.1 -O3. Кажется, это исправлено в 4.4, потому что там это работает. Изменение reinterpret_casts на указатели, хотя и несколько более уродливо, работает в обоих случаях.

Хотя размер uint32_t может быть эквивалентен размеру с плавающей точкой в заданной дуге, переосмысливая приведение от одного к другому, вы неявно предполагаете, что атомарные приращения, уменьшения и все другие операции над битами семантически эквивалентны для обоих типов, которых нет в реальности. Я сомневаюсь, что это работает как ожидалось.

Я сильно сомневаюсь, что вы получите правильные значения в fetch_and_add и т. Д., Поскольку добавление с плавающей точкой отличается от добавления int.

Вот что я получаю из этой арифметики:

1   + 1    =  1.70141e+038  
100 + 1    = -1.46937e-037  
100 + 0.01 =  1.56743e+038  
23  + 42   = -1.31655e-036  

Так что да, многопоточный, но не то, что вы ожидаете.

алгоритмы без блокировки (оператор + и т. д.) должны работать в отношении атомарности (не проверял сам алгоритм...)

Другое решение: Поскольку это все сложения и вычитания, вы можете дать каждому потоку свой экземпляр, а затем добавить результаты из нескольких потоков.

Пусть ваш компилятор сгенерирует ассемблерный код и посмотрите на него. Если операция является более чем одной инструкцией на языке ассемблера, то это не атомарная операция, и для правильной работы в многопроцессорных системах требуются блокировки.

К сожалению, я не уверен, что верно и обратное - что операции с одной инструкцией гарантированно будут атомарными. Я не знаю деталей многопроцессорного программирования до этого уровня. Я мог бы обосновать любой результат. (Если у кого-то еще есть определенная информация об этом, не стесняйтесь вмешиваться.)

После прочтения этого кода я был бы очень зол на такой компилятор, чтобы выпустить сборку для этого, который не был атомарным.

