Количественные метрики (тесты) по использованию библиотек C++ только для заголовков
Я пытался найти ответ на это с помощью SO. Есть ряд вопросов, в которых перечисляются различные плюсы и минусы создания библиотеки с заголовками в C++, но я не смог найти такую, которая бы делала это в количественном выражении.
Итак, в количественном выражении, что отличается между использованием традиционно разделенного заголовка C++ и файлов реализации и только заголовка?
Для простоты я предполагаю, что шаблоны не используются (потому что они требуют только заголовок).
Чтобы уточнить, я перечислил то, что я видел из статей, как плюсы и минусы. Очевидно, что некоторые из них не поддаются количественной оценке (например, простота использования) и, следовательно, бесполезны для поддающейся количественной оценке сравнения. Я отмечу те, которые я ожидаю количественно измеримых метрик с (количественно).
Плюсы только для заголовка
- Проще включить, так как вам не нужно указывать параметры компоновщика в вашей системе сборки.
- Вы всегда компилируете весь код библиотеки с помощью того же компилятора (опций), что и остальной код, так как функции библиотеки встроены в ваш код.
- Это может быть намного быстрее. (количественный)
- Может дать компилятору / компоновщику лучшие возможности для оптимизации (объяснение / количественная оценка, если это возможно)
- Требуется, если вы используете шаблоны в любом случае.
Минусы только для заголовка
- Это раздувает код. (количественно) (как это влияет на время выполнения и объем памяти)
- Больше времени компиляции. (количественный)
- Потеря разделения интерфейса и реализации.
- Иногда приводит к трудно разрешаемым круговым зависимостям.
- Предотвращает двоичную совместимость разделяемых библиотек /DLL.
- Это может усугубить сотрудников, которые предпочитают традиционные способы использования C++.
Будем очень благодарны за любые примеры, которые вы можете использовать из более крупных проектов с открытым исходным кодом (сравнивая кодовые базы одинакового размера). Или, если вы знаете о проекте, который может переключаться между версиями только с заголовками и отдельными версиями (используя третий файл, который включает обе), это было бы идеально. Также полезны анекдотические числа, потому что они дают мне примерную оценку, с помощью которой я могу получить некоторое представление.
источники за и против:
- /questions/25031199/biblioteka-shablonov-tolko-dlya-zagolovkov-c/25031234#25031234
- /questions/43249969/kakovyi-preimuschestva-i-nedostatki-realizatsii-klassov-v-zagolovochnyih-fajlah/43249977#43249977
Заранее спасибо...
ОБНОВИТЬ:
Для тех, кто читает это позже и заинтересован в получении дополнительной информации о компоновке и компиляции, я нашел эти ресурсы полезными:
- Глава 7 http://www.amazon.com/Computer-Systems-Programmers-Perspective-Edition/dp/0136108040
- http://www.yolinux.com/TUTORIALS/LibraryArchives-StaticAndDynamic.html
- http://www.cyberciti.biz/tips/linux-shared-library-management.html
ОБНОВЛЕНИЕ: (в ответ на комментарии ниже)
То, что ответы могут быть разными, не означает, что измерения бесполезны. Вы должны начать измерять как некоторую точку. И чем больше у вас измерений, тем четче будет картина. В этом вопросе я прошу не всю историю, а представление о картине. Конечно, любой может использовать числа, чтобы исказить аргумент, если он хотел неэтично продвигать свою предвзятость. Однако, если кому-то интересно узнать о различиях между двумя вариантами и опубликовать эти результаты, я думаю, что эта информация полезна.
Разве никто не интересовался этой темой, достаточно ли ее измерить?
Я люблю проект перестрелки. Мы могли бы начать с удаления большинства этих переменных. Используйте только одну версию gcc для одной версии linux. Используйте только одно и то же оборудование для всех тестов. Не компилировать с несколькими потоками.
Тогда мы можем измерить:
- размер исполняемого файла
- время выполнения
- след памяти
- время компиляции (как для всего проекта, так и путем изменения одного файла)
- время ссылки
3 ответа
Резюме (заметные моменты):
- Сравнение двух пакетов (один с 78 модулями компиляции, один с 301 модулем компиляции)
- Традиционная компиляция (Multi Unit Compilation) привела к ускорению работы приложения на 7% (в пакете из 78 модулей); без изменений во время выполнения приложения в пакете модуля 301.
- В тестах традиционной компиляции и только для заголовков при запуске использовался одинаковый объем памяти (в обоих пакетах).
- Компиляция только в заголовке (Компиляция из одного модуля) привела к тому, что размер исполняемого файла был на 10% меньше в пакете из 301 модуля (только на 1% меньше в пакете из 78 модулей).
- Традиционная компиляция использовала около трети памяти для сборки обоих пакетов.
- Традиционная компиляция заняла в три раза больше времени (при первой компиляции) и заняла только 4% времени при перекомпиляции (так как только заголовок должен перекомпилировать все исходные коды).
- Традиционная компиляция заняла больше времени, чтобы ссылаться как на первую, так и на последующую компиляцию.
Тест Box2D, данные:
Ботан тест, данные:
Box2D РЕЗЮМЕ (78 единиц)
ОБЗОР Ботана (301 шт.)
КРАСИВЫЕ ЧАРТЫ:
Размер исполняемого файла Box2D:
Box2D компиляция / ссылка / сборка / время выполнения:
Box2D компиляция / ссылка / сборка / запуск максимального использования памяти:
Размер исполняемого файла Botan:
Компиляция ботана / ссылка / сборка / время выполнения:
Ботаническая компиляция / ссылка / сборка / запуск максимального использования памяти:
Детали теста
TL;DR
Тестируемые проекты, Box2D и Botan, были выбраны потому, что они потенциально дорогостоящие в вычислительном отношении, содержат большое количество блоков и фактически содержат мало ошибок или вообще не содержат ошибок при компиляции как единое целое. Было предпринято много других проектов, но они занимали слишком много времени, чтобы "исправить" компиляцию как единое целое. Объем памяти измеряется путем опроса объема памяти через регулярные интервалы и с использованием максимума, и, следовательно, он может быть не совсем точным.
Кроме того, этот тест не выполняет автоматическую генерацию зависимостей заголовка (для обнаружения изменений заголовка). В проекте, использующем другую систему сборки, это может добавить время ко всем тестам.
В тесте 3 компилятора, каждый с 5 конфигурациями.
Составители:
- НКУ
- МЦХ
- лязг
Конфигурации компилятора:
- По умолчанию - параметры компилятора по умолчанию
- Оптимизировано родное -
-O3 -march=native
- Размер оптимизирован -
-Os
- LTO/IPO родной -
-O3 -flto -march=native
с лязгом и gcc,-O3 -ipo -march=native
с icpc/icc - Нулевая оптимизация -
-Os
Я думаю, что каждый из них может иметь разные ориентиры при сравнении сборок из одного и нескольких блоков. Я включил LTO/IPO, чтобы мы могли увидеть, как сравнивается "правильный" способ достижения единичной эффективности.
Объяснение полей CSV:
Test Name
- название эталона. Примеры:Botan, Box2D
,- Конфигурация теста - укажите конкретную конфигурацию этого теста (специальные флаги cxx и т. Д.). Обычно так же, как
Test Name
, Compiler
- имя используемого компилятора. Примеры:gcc,icc,clang
,Compiler Configuration
- имя конфигурации используемых опций компилятора. Пример:gcc opt native
Compiler Version String
- первая строка вывода версии компилятора из самого компилятора. Пример:g++ --version
производитg++ (GCC) 4.6.1
в моей системе.Header only
- значениеTrue
если этот тестовый пример был построен как единое целое,False
если бы он был построен как многоэлементный проект.Units
- количество единиц в тестовом примере, даже если оно построено как единое целое.Compile Time,Link Time,Build Time,Run Time
- как это звучит.Re-compile Time AVG,Re-compile Time MAX,Re-link Time AVG,Re-link Time MAX,Re-build Time AVG,Re-build Time MAX
- время перестройки проекта после прикосновения к одному файлу. Каждое подразделение затрагивается, и для каждого проект перестраивается. Максимальное время и среднее время записываются в этих полях.Compile Memory,Link Memory,Build Memory,Run Memory,Executable Size
- как они звучат.
Чтобы воспроизвести критерии:
- Бычья работа - это run.py.
- Требуется psutil (для измерения объема памяти).
- Требуется GNUMake.
- Как таковой, требует gcc, clang, icc/icpc в пути. Может быть изменен, чтобы удалить любой из них, конечно.
- Каждый бенчмарк должен иметь файл данных, в котором перечислены единицы этих бенчмарков. Затем run.py создаст два тестовых примера, один с каждым модулем, скомпилированным отдельно, и один с каждым модулем, скомпилированным вместе. Пример: box2d.data. Формат файла определяется как строка json, содержащая словарь со следующими ключами
"units"
- списокc/cpp/cc
файлы, которые составляют единицы этого проекта"executable"
- Имя исполняемого файла для компиляции."link_libs"
- Разделенный пробелами список установленных библиотек для ссылки."include_directores"
- Список каталогов для включения в проект."command"
- необязательный. специальная команда для запуска теста. Например,"command": "botan_test --benchmark"
- Не все проекты C++ могут быть легко выполнены; не должно быть никаких конфликтов / неясностей в едином блоке.
- Чтобы добавить проект в тестовые наборы, измените список
test_base_cases
в run.py с информацией о проекте, включая имя файла данных. - Если все хорошо, выходной файл
data.csv
должен содержать результаты тестов.
Для создания гистограммы:
- Вы должны начать с файла data.csv, созданного тестом.
- Получите chart.py. Требуется матплотлиб.
- Настроить
fields
список, чтобы решить, какие графики производить. - Бежать
python chart.py data.csv
, - Файл,
test.png
теперь должен содержать результат.
Box2D
- Box2D использовался из svn как есть, ревизия 251.
- Этот тест был взят отсюда, изменен здесь и, возможно, не является представительным для хорошего теста Box2D, и он может не использовать достаточно Box2D, чтобы оправдать этот тест компилятора.
- Файл box2d.data был написан вручную, найдя все модули.cpp.
Ботан
- Использование Botan-1.10.3.
- Файл данных: botan_bench.data.
- Первый побежал
./configure.py --disable-asm --with-openssl --enable-modules=asn1,benchmark,block,cms,engine,entropy,filters,hash,kdf,mac,bigint,ec_gfp,mp_generic,numbertheory,mutex,rng,ssl,stream,cvc
, это генерирует заголовочные файлы и Makefile. - Я отключил сборку, потому что сборка может мешать оптимизации, которая может происходить, когда границы функций не блокируют оптимизацию. Тем не менее, это гипотеза и может быть совершенно неправильно.
- Затем запустил команды, как
grep -o "\./src.*cpp" Makefile
а такжеgrep -o "\./checks.*" Makefile
чтобы получить модули.cpp и поместить их в файл botan_bench.data. - модифицированный
/checks/checks.cpp
не вызывать модульные тесты x509 и убрал проверку x509 из-за конфликта между Botan typedef и openssl. - Был использован эталон, включенный в источник Botan.
Системные характеристики:
- OpenSuse 11.4, 32-битная версия
- 4 ГБ ОЗУ
Intel(R) Core(TM) i7 CPU Q 720 @ 1.60GHz
Обновить
Это был оригинальный ответ Реального Слава. Его ответ выше (принятый) является его второй попыткой. Я чувствую, что его вторая попытка полностью отвечает на вопрос. - Homer6
Что ж, для сравнения вы можете посмотреть на идею "единства сборки" (ничего общего с графическим движком). По сути, "единство сборки" - это то, где вы включаете все файлы cpp в один файл и компилируете их все как один модуль компиляции. Я думаю, что это должно обеспечить хорошее сравнение, поскольку AFAICT, это эквивалентно тому, чтобы сделать ваш проект только заголовком. Вы будете удивлены 2-м "жуликом", который вы перечислили весь смысл "построения единства" заключается в уменьшении времени компиляции. Предположительно, единство компилируется быстрее, потому что они:
.. являются способом сокращения накладных расходов на сборку (в частности, открытием и закрытием файлов и сокращением времени компоновки за счет сокращения числа создаваемых объектных файлов) и, как таковые, используются для существенного ускорения времени сборки
Сравнение времени компиляции ( отсюда):
Три основных ссылки на "Единство построения":
- http://buffered.io/posts/the-magic-of-unity-builds/
- http://cheind.wordpress.com/2009/12/10/reducing-compilation-time-unity-builds/
- http://www.altdevblogaday.com/2011/08/14/the-evils-of-unity-builds/
Я полагаю, вам нужны причины плюсов и минусов.
Плюсы только для заголовка
[...]
3) Это может быть намного быстрее. (количественно) Код может быть оптимизирован лучше. Причина в том, что, когда блоки разделены, функция является просто вызовом функции, и поэтому должна быть оставлена таковой. Информация об этом звонке неизвестна, например:
- Изменит ли эта функция память (и, следовательно, наши регистры, отражающие эти переменные / память, будут устаревшими, когда она вернется)?
- Эта функция смотрит на глобальную память (и, следовательно, мы не можем изменить порядок, где мы вызываем функцию)
- и т.п.
Кроме того, если внутренний код функции известен, возможно, стоит встроить его (то есть выгрузить его код непосредственно в вызывающую функцию). Встраивание позволяет избежать накладных расходов на вызов функции. Встраивание также позволяет выполнять целый ряд других оптимизаций (например, постоянное распространение; например, мы называем factorial(10)
теперь, если компилятор не знает код factorial()
, он вынужден оставить это так, но если мы знаем исходный код factorial()
мы можем фактически изменить переменные в функции и заменить ее на 10, и, если нам повезет, мы можем даже получить ответ во время компиляции, вообще ничего не выполняя во время выполнения). Другие оптимизации после встраивания включают устранение мертвого кода и (возможно) лучшее предсказание ветвления.
4) Может дать компилятору / компоновщику лучшие возможности для оптимизации (объяснение / количественно, если возможно)
Я думаю, что это следует из (3).
Минусы только для заголовка
1) Раздувает код. (количественно) (как это влияет как на время выполнения, так и на объем занимаемой памяти) Только заголовок может раздуть код несколькими способами, которые я знаю.
Первое - это раздувание шаблона; где компилятор создает ненужные шаблоны типов, которые никогда не используются. Это относится не только к заголовкам, но скорее к шаблонам, и современные компиляторы улучшили это, чтобы сделать его минимальным.
Второй, более очевидный способ - это (чрезмерное) встраивание функций. Если большая функция встроена везде, где она используется, эти вызывающие функции будут увеличиваться в размере. Возможно, это беспокоило размер исполняемых файлов и объем памяти исполняемых образов много лет назад, но пространство на жестком диске и объем памяти выросли, что делает его практически бесполезным. Более важная проблема заключается в том, что этот увеличенный размер функции может испортить кэш команд (так что теперь более крупная функция не помещается в кэш, и теперь кэш должен быть пополнен, поскольку ЦПУ выполняет эту функцию). Давление в регистре будет увеличиваться после встраивания (существует ограничение на количество регистров, объем оперативной памяти, с которой процессор может работать напрямую). Это означает, что компилятор должен будет манипулировать регистрами в середине теперь более крупной функции, потому что там слишком много переменных.
2) Более длительное время компиляции. (Количественный)
Что ж, компиляция только в заголовках может логически привести к более длительному времени компиляции по многим причинам (несмотря на производительность "сборок единства"; логика не обязательно является реальной, где задействованы другие факторы). Одной из причин может быть то, что если весь проект только для заголовков, мы теряем инкрементные сборки. Это означает, что любое изменение в любой части проекта означает, что весь проект должен быть перестроен, в то время как с отдельными модулями компиляции изменения в одном cpp просто означают, что объектный файл должен быть перестроен, а проект перекомпонован.
По моему (неподтвержденному) опыту, это большой успех. Только заголовки в некоторых особых случаях значительно повышают производительность, но с точки зрения производительности это обычно не стоит. Когда вы начинаете получать большую кодовую базу, время компиляции с нуля может занять> 10 минут каждый раз. Перекомпиляция на крошечном изменении начинает становиться утомительной. Вы не знаете, сколько раз я забыл ";" и пришлось ждать 5 минут, чтобы услышать об этом, только чтобы вернуться и исправить это, а затем подождать еще 5 минут, чтобы найти что-то еще, что я только что представил, исправив ";".
Производительность отличная, производительность намного лучше; это потратит большую часть вашего времени и демотивирует / отвлечет вас от вашей цели программирования.
Редактировать: я должен упомянуть, что межпроцедурная оптимизация (см. Также оптимизация во время соединения и оптимизация всей программы) пытается реализовать преимущества оптимизации "единой сборки". Реализация этого все еще немного шатка в большинстве компиляторов AFAIK, но в конечном итоге это может преодолеть преимущества производительности.
Я надеюсь, что это не слишком похоже на то, что сказал Realz.
Размер исполняемого файла (/ объекта): (исполняемый файл на 0% / объект больше на 50% только в заголовке)
Я бы предположил, что определенные функции в заголовочном файле будут скопированы в каждый объект. Когда дело доходит до генерации исполняемого файла, я бы сказал, что довольно просто вырезать дублирующиеся функции (понятия не имею, какие компоновщики делают / не делают это, я полагаю, большинство это делают), поэтому (вероятно) никакой реальной разницы в размер исполняемого файла, но хорошо в размер объекта. Разница должна в значительной степени зависеть от того, сколько кода на самом деле находится в заголовках по сравнению с остальной частью проекта. Не то, чтобы размер объекта действительно имел значение в наши дни, за исключением времени ссылки.
Время выполнения: (1%)
Я бы сказал, что в основном идентично (адрес функции - это адрес функции), за исключением встроенных функций. Я ожидаю, что встроенные функции будут иметь различие в вашей средней программе менее чем на 1%, потому что вызовы функций имеют некоторые накладные расходы, но это ничто по сравнению с накладными расходами на выполнение каких-либо действий с программой.
Объем памяти: (0%)
Те же вещи в исполняемом файле = тот же объем памяти (во время выполнения), при условии, что компоновщик удаляет дублирующиеся функции. Если дублирующиеся функции не вырезаны, это может иметь большое значение.
Время компиляции (как для всего проекта, так и путем изменения одного файла): (на целых до 50% быстрее для одного, одного на 99% быстрее для не только заголовка)
Огромная разница. Изменение чего-либо в заголовочном файле вызывает перекомпиляцию всего, что включает его, в то время как изменения в файле cpp просто требуют пересоздания этого объекта и повторной ссылки. И на 50% медленнее для полной компиляции только для библиотек с заголовками. Тем не менее, с предварительной компиляцией заголовков или сборок Unity полная компиляция с библиотеками только для заголовков, вероятно, будет быстрее, но одно изменение, требующее перекомпиляции большого количества файлов, является огромным недостатком, и я бы сказал, что это того не стоит, Полные перекомпиляции часто не нужны. Кроме того, вы можете включить что-то в файл cpp, но не в его заголовочный файл (это может часто случаться), поэтому в правильно спроектированной программе (древовидная структура зависимостей / модульность), когда изменяется объявление функции или что-то (всегда требуется изменения в файл заголовка), только заголовок может привести к перекомпиляции многих вещей, но с не только заголовком вы можете значительно ограничить это.
Время соединения: (до 50% быстрее только для заголовков)
Объекты, вероятно, больше, поэтому их обработка займет больше времени. Вероятно, линейно пропорционально тому, насколько больше файлы. Из моего ограниченного опыта в больших проектах (где время компиляции + ссылки достаточно много, чтобы иметь значение), время линковки практически ничтожно по сравнению со временем компиляции (если вы не будете вносить небольшие изменения и строить, тогда я ожидаю, что вы почувствуете это что, я полагаю, может случиться часто).