Пользовательское распределение с использованием boost singleton_pool медленнее, чем по умолчанию
Я написал пользовательский оператор new и оператор delete для класса MyOrder. Я выделяю память с помощью Boost:: Singleton Pool. Вот программа тестирования производительности,
#include <boost/pool/singleton_pool.hpp>
#include <boost/progress.hpp>
#include <iostream>
#include <new>
#include <vector>
class MyOrder{
std::vector<int> v1_;
std::vector<double> v2_;
std::string s1_;
std::string s2_;
public:
MyOrder(std::string s1, std::string s2): s1_(s1), s2_(s2) {}
~MyOrder(){}
static void * operator new(size_t size);
static void operator delete(void * rawMemory) throw();
};
struct MyOrderTag{};
typedef boost::singleton_pool<MyOrderTag, sizeof(MyOrder)> MyOrderPool;
void* MyOrder:: operator new(size_t size)
{
if (size != sizeof(MyOrder))
return ::operator new(size);
while(true){
void * ptr = MyOrderPool::malloc();
if (ptr != NULL) return ptr;
std::new_handler globalNewHandler = std::set_new_handler(0);
std::set_new_handler(globalNewHandler);
if(globalNewHandler) globalNewHandler();
else throw std::bad_alloc();
}
}
void MyOrder::operator delete(void * rawMemory) throw()
{
if(rawMemory == 0) return;
MyOrderPool::free(rawMemory);
}
int main()
{
MyOrder* mo = NULL;
std::vector<MyOrder*> v;
v.reserve(100000);
boost::progress_timer howlong;
for(int i = 0; i< 100000; ++i)
{
mo = new MyOrder("Sanket", "Sharma");
v.push_back(mo);
}
for (std::vector<MyOrder*>::const_iterator it = v.begin(); it != v.end(); ++it)
{
delete *it;
}
return 0;
}
Я скомпилировал вышеупомянутую программу, используя флаг -O2, и запустился на своем Macbook с 2,26 ГГц Intel Core 2 Duo, и это заняло 0,16 секунды. Затем я прокомментировал строки, в которых я объявил и определил пользовательский оператор new и оператор delete, перекомпилировал с флагами -O2 и запустил на той же машине, что заняло 0,13 секунды.
Выделение и освобождение памяти с помощью singleton_pool для объектов одинакового размера должно ускорить ее. Почему это делает это медленно? Или затраты на создание пула сводят на нет выигрыш в производительности, полученный в этой маленькой программе?
Обновить:
Я заменил две переменные std::string на int и double и на этот раз запустил две программы по 100000000 (то есть 1000 раз до) итераций каждая на процессоре AMD Phenom(tm) II X4 945 с тактовой частотой 3,0 ГГц. Тот, который использует пользовательское выделение памяти, занимает 3,2 секунды, а тот, который использует распределение памяти по умолчанию, занимает 8,26 секунды. Так что на этот раз пользовательское распределение памяти выигрывает.
1 ответ
Я думаю, что ваши цифры не имеют смысла. Если вы проверили время выполнения только один раз, и вы нашли 0.13
против 0.16
секунд, чем это совершенно бессмысленно, и доминируют над головой.
Вы должны запустить фрагмент, который вы хотите протестировать тысячи раз, а затем сравнить данные, чтобы исключить накладные расходы.
Нет, правда, что 0.03
Разница в секундах может быть легко объяснена отключением вашего процесса и т. д.