Пользовательское распределение с использованием boost singleton_pool медленнее, чем по умолчанию

Я написал пользовательский оператор new и оператор delete для класса MyOrder. Я выделяю память с помощью Boost:: Singleton Pool. Вот программа тестирования производительности,

#include <boost/pool/singleton_pool.hpp>
#include <boost/progress.hpp>
#include <iostream>
#include <new>
#include <vector>


class MyOrder{
    std::vector<int> v1_;
    std::vector<double> v2_;

    std::string s1_;
    std::string s2_;

public:
    MyOrder(std::string s1, std::string s2): s1_(s1), s2_(s2) {}

    ~MyOrder(){}

    static void * operator new(size_t size); 
    static void operator delete(void * rawMemory) throw();
};

struct MyOrderTag{};
typedef boost::singleton_pool<MyOrderTag, sizeof(MyOrder)> MyOrderPool; 

void* MyOrder:: operator new(size_t size)
{
    if (size != sizeof(MyOrder)) 
        return ::operator new(size);

    while(true){
        void * ptr = MyOrderPool::malloc();
        if (ptr != NULL) return ptr;

        std::new_handler globalNewHandler = std::set_new_handler(0);
        std::set_new_handler(globalNewHandler);

        if(globalNewHandler)  globalNewHandler();
        else throw std::bad_alloc();

    }
}

void MyOrder::operator delete(void * rawMemory) throw()
{
    if(rawMemory == 0) return; 
    MyOrderPool::free(rawMemory);
}

int main()
{
    MyOrder* mo = NULL; 
    std::vector<MyOrder*> v;
    v.reserve(100000);

    boost::progress_timer howlong;
    for(int i = 0; i< 100000; ++i)
    {
        mo = new MyOrder("Sanket", "Sharma");
        v.push_back(mo);
    }

    for (std::vector<MyOrder*>::const_iterator it = v.begin(); it != v.end(); ++it)
    {
        delete *it;
    }
    return 0;
}

Я скомпилировал вышеупомянутую программу, используя флаг -O2, и запустился на своем Macbook с 2,26 ГГц Intel Core 2 Duo, и это заняло 0,16 секунды. Затем я прокомментировал строки, в которых я объявил и определил пользовательский оператор new и оператор delete, перекомпилировал с флагами -O2 и запустил на той же машине, что заняло 0,13 секунды.

Выделение и освобождение памяти с помощью singleton_pool для объектов одинакового размера должно ускорить ее. Почему это делает это медленно? Или затраты на создание пула сводят на нет выигрыш в производительности, полученный в этой маленькой программе?

Обновить:

Я заменил две переменные std::string на int и double и на этот раз запустил две программы по 100000000 (то есть 1000 раз до) итераций каждая на процессоре AMD Phenom(tm) II X4 945 с тактовой частотой 3,0 ГГц. Тот, который использует пользовательское выделение памяти, занимает 3,2 секунды, а тот, который использует распределение памяти по умолчанию, занимает 8,26 секунды. Так что на этот раз пользовательское распределение памяти выигрывает.

1 ответ

Я думаю, что ваши цифры не имеют смысла. Если вы проверили время выполнения только один раз, и вы нашли 0.13 против 0.16 секунд, чем это совершенно бессмысленно, и доминируют над головой.

Вы должны запустить фрагмент, который вы хотите протестировать тысячи раз, а затем сравнить данные, чтобы исключить накладные расходы.

Нет, правда, что 0.03 Разница в секундах может быть легко объяснена отключением вашего процесса и т. д.

Другие вопросы по тегам