Что будет после двухъядерных процессоров Intel Xeon Broadwell?
Я собираю данные для сравнения производительности CPU и GPU GFLOP, и в настоящее время я смотрю на двухпроцессорные ЦП (семейство E5-26xx), однако после Broadwell выходит архитектура Skylake, которая имеет семейства двухпроцессорных Bronze и Silver, но у них половина ядра и производительность, чем у Broadwell. Я что-то пропустил?
2 ответа
Интересно, что вы правы, что единственные чипы Skylake-сервера с большим количеством ядер также могут использоваться в 4-сокетных системах. ( https://en.wikichip.org/wiki/intel/microarchitectures/skylake_(server))
Вы можете разместить процессоры Gold / Platinum в системах с двумя сокетами. Я предполагаю, что большая часть того, за что вы платите в центральных процессорах с большим количеством ядер, это сами ядра / кэш, поэтому их использование в системе с 2 сокетами не является пустой тратой.
SKX использует UPI вместо QPI в качестве соединения между сокетами. В системе 4P можно использовать ЦП с 2 ссылками UPI, образуя кольцо вместо общего набора с 3 ссылками в каждом ЦП. Или система 2P может использовать все 3 канала UPI между двумя сокетами для большей пропускной способности. ( Викичип имеет диаграммы)
Процессоры Bronze / Silver и Gold 5xxx имеют 2 канала UPI, в то время как процессоры Gold 6xxx и Platinum имеют 3 канала UPI. ( википедия)
Внутри каждого процессора Skylake-SP (на одном кристалле) взаимосвязь между ядрами представляет собой сетку по сравнению с кольцевой шиной в Broadwell и ранее.
4P/8P Broadwell (и более ранние) Xeons имеют небольшой (14 кБ? Я не могу найти более подробное описание прямо сейчас) кэш фильтра снупа (см. Сообщение Джона Маккальпина в этой теме, но чипы 2P этого не делают, и просто транслируют снуп запросы к другому сокету при загрузке из локальной DRAM, когда загрузка отсутствует в L3. Это "использует скромную долю пропускной способности QPI". (Точное поведение отслеживания настраивается в различных режимах для оптимизации локальной памяти с малой задержкой по сравнению с меньшая задержка для удаленной памяти и т. д.)
Таким образом, между чипами 2P и 4P/8P существует аппаратное (а не только искусственное маркетинг / сегментирование рынка) различие в количестве ядер для Broadwell и более ранних версий.
Skylake-SP всегда имеет Snoop-фильтр. См. Раздел "Согласованность на основе каталогов" в статье Intel по внутренним компонентам Skylake-Xeon.
(ИДК подробности. Возможно, бронзовые / серебряные фишки слабее, но их отдел маркетинга решил, что не стоит проводить более тонкую сегментацию рынка внутри золотых фишек.)
Вы ничего не пропустите с точки зрения кодовых имен поколений процессоров Intel, но ваше утверждение о "половине производительности" неясно. В частности, какие именно артикулы вы сравниваете? И почему вы решили сравнить именно ту продукцию разных поколений? Официальная база данных находится по адресу http://ark.intel.com/, там вы можете найти модели одних и тех же сегментов рынка разных поколений.