Intel Broadwell Xeon E3-1200 v4 — все что надо знать про новую линейку Xeon и eDRAM

от автора

Intel недавно представила обновленную линейку новых четырехъядерных процессоров Intel Broadwell Xeon E3-1200 v4. Серия серверных процессоров Intel Xeon E3-1200 v3 появилась на рынке во 2-м квартале 2013 года и и была тихо обновлена во втором квартале 2014 года на модели типа Е3-1231 v3. Теперь анонсированы Xeon v4. Разберемся: что же нового предлагает нам Intel?

В терминологии стратеги «тик-так», Broadwell это «тик»: производитель использовал архитектуру Haswell в 14-нанометровом исполнении. «Тик» не предполагает революционных изменений. Аналитики считают, что в этой фазе Intel допиливает известные технологии, а улучшения будут косметические.
По спецификации Broadwell обеспечивает пониженное энергопотребление и сопоставимую с процессорами предыдущего поколения общую производительность.

Рассмотрим три новых серверных процессора Intel Xeon E3-1200 v4 на сокете LGA 1150.

Процессор Xeon E3-1285 v4 Xeon E3-1285L v4 Xeon E3-1265L v4
Ядра/потоки 4/8 4/8 4/8
Технология Hyper-Threading Есть Есть Есть
Тактовая частота 3,5 ГГц 3,4 ГГц 2,3 ГГц
Максимальная частота в турбо-режиме 3,8 ГГц 3,8 ГГц 3,3 ГГц
Разблокированный множитель Нет Нет Нет
TDP 95 Вт 65 Вт 35 Вт
HD Graphics Iris Pro P6300 Iris Pro P6300 Iris Pro P6300
Частота графического ядра 1150 МГц 1150 МГц 1050 МГц
L3-кэш 6 Мбайт 6 Мбайт 6 Мбайт
Интегрированная eDRAM 128 Мбайт 128 Мбайт 128 Мбайт
Поддержка DDR3 1333/1600/1866 1333/1600/1866 1333/1600/1866
Технологии vPro/TSX-NI/TXT/VT-d Есть Есть Есть
Расширения набора инструкций AVX 2.0 AVX 2.0 AVX 2.0
Сокет LGA1150 LGA1150 LGA1150

Объем кэш-памяти третьего уровня урезан на 2 Мб, то есть на четверть по сравнению с предыдущими моделями Xeon. Как замечает www.anandtech.com, потеря 2 Мб L3 несущественна, учитывая появление eDRAM объемом 128 МБ в L4.

Что такое eDRAM?

В начале 2007 года Intel и IBM совместно с AMD, Toshiba и Sony почти одновременно заявили о технологии, которая позволит ускорить работу процессоров в два раза. Для этого было предложено использовать память eDRAM (embedded DRAM), которая будет применяться вместе с технологией «кремний на изоляторе» (SOI, Silicon-on-Insulator). В IBM заявили, что это позволит существенно ускорить кэш-память, в три раза увеличить ее плотность и в пять раз уменьшить потребляемую мощность в режиме бездействия процессора. Тогда планировалось использовать кэш-память объемом 24 Мб.
Технологически embedded DRAM — это DRAM, встраиваемая («embedded») в процессор в отличие от SDRAM. eDRAM требует напряжения 1 В, что заметно ниже питания обычной памяти. На практике это означает, что eDRAM потребляет меньше энергии, обеспечивая сопоставимое быстродействие. Ячейки eDRAM меньшего размера — 0.108um² для SRAM и 0.029um² для eDRAM — на чип того же размера влезет на порядок больше чуть более медленных ячеек памяти.

Intel не только поставил известный Haswell на 14-нанометровые рельсы. В процессорах Broadwell производитель использовал возможности eDRAM настолько полно, насколько это сегодня возможно. Производитель заявляет о 25% улучшении таких параметров, как энергопотребление и тепловыделение.

Кристалл eDRAM Crystalwell объемом 128 МБ играет роль кэш-памяти четвертого уровня. Кэш подобного объема был у Haswell, но лишь в топовых моделях E7. При этом eDRAM может использоваться и графическим ядром, и вычислительными ядрами процессора при обработке больших объемов данных — например, текстур. По заявлению производителя, Crystalwell обеспечивает пиковую пропускную способность на уровне 51,2 Гбайт/с в каждую сторону (102,4 Гбайт/с суммарно).

Согласно тестам, проведенным 3Dnews.ru, латентность основанного на eDRAM L4-кэша составляет 55 тактов, а пропускная способность — примерно вдвое выше по сравнению с двухканальной DDR3-1866 SDRAM.
Crystalwell позволяет процессору преодолеть относительные ограничения низкой пропускной способности системной памяти и показать лучшее быстродействие в задачах по обработке HD-видео и в математических операциях.
Согласно собственным тестам Intel (использовался Supermicro SuperServer), при использовании Broadwell возможна одновременная обработка 4368 HD-видеопотоков. Этот же показатель при использовании процессоров Haswell составляет 3120. Налицо увеличение производительности на 40%. Все материнские платы Supermicro серии Х10 подерживают v4 после обновления BIOS.

Видеоядро Iris Pro Graphics

В новой линейке процессоров использовано графическое ядро Iris Pro Graphics, «облегченную» версию которого ранее можно было встретить только в мобильных процессорах Haswell. Теперь Iris Pro Graphics P6300 имеет конфигурацию GT3е и 48 исполнительных устройств (EU, execution units) против 40 EU в графических ядрах Iris Pro Graphics 5100 и 5200 у Haswell.
Использование Iris Pro Graphics P6300 является и существенным отличием новых Xeon от Xeon E3-1200 v3 на Broadwell: в прошлой линейке использовались менее продвинутые Intel HD Graphics P4600 и Intel HD Graphics P4700.
Понятным преимуществом рассматриваемых процессоров является то, что устанавливаются они в слот LGA1150: владельцы материнских плат на основе набора системной логики Intel Z97 и Intel H97 могут легко апгрейдить систему. Формально новые Xeon совместимы с материнскими платами на основе набора системной логики восьмой серии на сокете LGA1150.
Пользователи, обновляющиеся с Haswell на Broadwell, теперь могут сделать это сравнительно дешево. Так, если рекомендованные цены Intel на E3-1285L v3 составляют $774, то стоимость E3-1285L v4 — $445.
Недостатком для некоторых пользователей может оказаться невозможность разгона этих процессоров. Впрочем, эта серия Xeon — серверное решение, а любителям оверклокинга производитель предлагает другие процессоры новой линейки.

Тесты

В ряде тестов, проведенных www.anandtech.com, процессоры Intel Broadwell Xeon E3-1200 v4 показали противоречивые результаты.

При архивировании 2867 файлов общим объемом 1,52 Гб лучший результат показал E3-1285L v4, обогнав даже более мощный E3-1285 v4.

Однако в других тестах Xeon отставал от конкурентов. Конвертация серии из 170 изображений с помощью приложения FastStone Image Viewer v.4.9 оказалась для новых Xeon довольно сложной задачей.

Запуск эмулятора игровых консолей Dolphin показал, что в отработке 3D-сцен Intel Broadwell Xeon E3-1200 v4 опережает только слабые процессоры.

В то же время при конвертировании видео формата x264 в mp4 Broadwell отстал только от Intel Core i7 6700К.

Подводем итоги

Линейка процессоров Intel Broadwell Xeon E3-1200 v4 благодаря использованию нового кристалла памяти eDRAM обгоняет старые модели в решении тяжелых вычислительных задач и обработке HD-видео при сниженных значениях мощности и тепловыделения.

Для чего они нужны:

1) высокопроизводительные графические станции

2) выделенные сервера выполняющие задачи транскодирования и потокового вещания без использования GPU типа Tesla. Новые процессоры Интел показывают 40% к производительности на таких задачах и позволяют снизить издержки на аппаратную часть транскодеров. Тут приведена сравнительная таблица производительности для продуктов онлайн-вещания Wowza — какие процессоры для каких задач подходят.

2) выделенные сервера позволяющие виртуализировать графические приложения — для этого раньше было нужно ставить Теслу или что-то подобное

Мы в Hostkey предлагаем в аренду выделенные сервера в Москве и Нидерландах — новый тип процессоров для виртуализации 3Д приложений и стриминга/обработки видео появится у нас в начале 2016 года.

Для подобных задач мы рекомендуем клиентам использовать многоядерные процессоры Xeon старших серий, например машина в конфигурации 2х Xeon E5-2670 v2 с 20 ядрами на 2,5ГГц в на базе суперкомпьютерной платформы Т-Платформы и 32Гб памяти обойдется в 23000 рублей в месяц.

ссылка на оригинал статьи http://habrahabr.ru/post/266519/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *