Общая функция remove() vs Функция-член remove () для связанного списка

Я читаю книгу "C++ STL. Учебное пособие и ссылки", написанную Николаем М. Джозуттисом, и в одной из глав, посвященных алгоритмам STL, автор заявляет следующее: Если вы вызываете remove() для элементов списка, алгоритм не знает, что он работает со списком, и поэтому делает то, что делает для любого контейнера: переупорядочивает элементы, изменяя их значения. Если, например, алгоритм удаляет первый элемент, все последующие элементы назначаются их предыдущим элементам. Такое поведение противоречит главному преимуществу списков: возможность вставлять, перемещать и удалять элементы, изменяя ссылки вместо значений. Чтобы избежать плохой работы, списки предоставляют специальные функции-члены для всех алгоритмов манипулирования. Вы должны всегда предпочитать их. Кроме того, эти функции-члены действительно удаляют "удаленные" элементы, как показано в следующем примере:

#include <list>
#include <algorithm>
using namespace std;
int main()
{
list<int> coll;
// insert elements from 6 to 1 and 1 to 6
for (int i=1; i<=6; ++i) {
coll.push_front(i);
coll.push_back(i);
}
// remove all elements with value 3 (poor performance)
coll.erase (remove(coll.begin(),coll.end(),
3),
coll.end());
// remove all elements with value 4 (good performance)
coll.remove (4);
}

Конечно, это кажется достаточно убедительным для дальнейших рассуждений, но в любом случае, я решил увидеть результат запуска аналогичного кода на моем ПК, особенно в среде MSVC 2013. Вот мой код импровизированный:

int main()
{
    srand(time(nullptr));
    list<int>my_list1;
    list<int>my_list2;
    int x = 2000 * 2000;

    for (auto i = 0; i < x; ++i)
    {
        auto random = rand() % 10;
        my_list1.push_back(random);
        my_list1.push_front(random);
    }

    list<int>my_list2(my_list1);

    auto started1 = std::chrono::high_resolution_clock::now();
    my_list1.remove(5);
    auto done1 = std::chrono::high_resolution_clock::now();
    cout << "Execution time while using member function remove: " << chrono::duration_cast<chrono::milliseconds>(done1 - started1).count();

    cout << endl << endl;

    auto started2 = std::chrono::high_resolution_clock::now();
    my_list2.erase(remove(my_list2.begin(), my_list2.end(),5), my_list2.end());
    auto done2 = std::chrono::high_resolution_clock::now();
    cout << "Execution time while using generic algorithm remove: " << chrono::duration_cast<chrono::milliseconds>(done2 - started2).count();

    cout << endl << endl;
}

Я был удивлен, когда увидел следующий вывод:

Execution time while using member function remove: 10773

Execution time while using generic algorithm remove: 7459 

Не могли бы вы объяснить, что может быть причиной такого противоречивого поведения?

1 ответ

Это проблема кеширования. Большинство проблем с производительностью - это проблемы с кэшированием. Мы всегда хотим думать, что алгоритм - это первое, на что нужно обратить внимание. Однако, если вы намеренно заставите компилятор использовать память из разных мест за один прогон, а память - из следующего местоположения при следующем прогоне, вы увидите проблему с кэшированием.

Комментируя push_back или push_front при создании исходного списка я заставил компилятор создать код для построения списка с непрерывными элементами памяти в my_list1,

my_list2 всегда находится в непрерывной памяти, потому что он размещен в одной копии.

Выполнить вывод:

Execution time while using member function remove: 121

Execution time while using generic algorithm remove: 125


Process finished with exit code 0

Вот мой код с одним из комментариев закомментированных.

#include <list>
#include <algorithm>
#include <chrono>
#include <iostream>

using namespace std;

int main()
{
    srand(time(nullptr));
    list<int>my_list1;
//    list<int>my_list2;
    int x = 2000 * 2000;

    for (auto i = 0; i < x; ++i)
    {
        auto random = rand() % 10;
//        my_list1.push_back(random);  // avoid pushing to front and back to avoid cache misses.
        my_list1.push_front(random);
    }

    list<int>my_list2(my_list1);

    auto started1 = std::chrono::high_resolution_clock::now();
    my_list1.remove(5);
    auto done1 = std::chrono::high_resolution_clock::now();
    cout << "Execution time while using member function remove: " << chrono::duration_cast<chrono::milliseconds>(done1 - started1).count();

    cout << endl << endl;

    auto started2 = std::chrono::high_resolution_clock::now();
    my_list2.erase(remove(my_list2.begin(), my_list2.end(),5), my_list2.end());
    auto done2 = std::chrono::high_resolution_clock::now();
    cout << "Execution time while using generic algorithm erase: " << chrono::duration_cast<chrono::milliseconds>(done2 - started2).count();

    cout << endl << endl;
}

Увеличивая количество элементов и меняя порядок вызовов, чтобы сначала было выполнено удаление, а затем - удаление, удаление займет больше времени. Опять же, это больше о кешировании, чем об алгоритме или объеме выполняемой работы. Если вы запускаете другую программу, которая загрязняет кэш, проверяет Интернет или перемещает мышь, ваш кэш L1 объемом 32 КБ будет загрязнен, и производительность для этого запуска снизится.

Другие вопросы по тегам