1155 vs 2011. В бой идут одни старики

В 2017 году AMD в очередной раз приоткрыла ящик Пандоры, выпустив на рынок mainstream процессоры с количеством ядер больше четырёх, при этом с производительностью на ядро хотя бы сравнимой с современными процессорами Intel при равных частотах. Полного паритета не вышло, но полутора-двукратного разрыва в зависимости от типа нагрузки, как во времена FX-ов, уже нет. В синтетике производительность ядер Ryzen примерна равна производительности ядер Ivy Bridge (3xxx). Ход оказался довольно таки сильным, так что синей команде пришлось спешно выпускать шестиядерники на обновлённом 1151. К чему это я? А собственно к тому, что с прошлого года шести и более ядерные процессоры с быстрыми ядрами перебрались в потребительский сегмент из узкой HEDT ниши. Кроме всего прочего это значит, что массовое ПО наконец всё же начали оптимизировать под многоядерные многопоточные CPU.

Что такое современный массовый 6-8-ядерный процессор? Это частота 3.5-4.5GHz, относительно быстрая межъядерная шина той или иной архитектуры, двухканальная память DDR4 с частотой 2.4+ GHz. При этом ядра того же Ryzen рекордов производительности на такт не бьют. А что если… вместо современной и достаточно дорогой платформы взять старую 2011 платформу Intel, благо сейчас предложение списанных серверных процессоров линеек E5 v1 и v2 под этот сокет явно превышает спрос? Тем более предприимчивые китайцы, увидев такую ситуацию, оперативно освоили массовый выпуск материнских плат под эту платформу, а остальные комплектующие, процессор с памятью, стоят на вторичном рынке сравнительно недорого да и старению особо не подвержены. Пропускная способность регистровой DDR3 памяти пониже будет на один канал, чем у DDR4, но зато и каналов памяти на этой платформе четыре.

Платформы Ryzen у меня под рукой нет, поэтому будем сравнивать имеющиеся конфиги, все относящиеся к поколения Ivy Bridge. В общем-то сравниваются малосравнимые в своё время (по крайней мере по цене) платформы, но время всех уравнивает.

Участники тестирования

В тесте принимали участие следующие конфигурации:

CPU: Intel Core I7-3770K@4440MHz
MB: ASUS P8Z77-V LX
RAM: 2 x DDR3 Kingston Hyper-X 8GB 1600@2150MHz

CPU: Intel Xeon E5-1650v2@4100MHz
MB: Huanan X79 v2.49p (BIOS 4.6.5)
RAM: 4 x DDR3 Samsung 4GB 1333@1866MHz

CPU: Intel Xeon E5-2680v2
MB: Huanan X79 v2.49p
RAM: 4 x DDR3 Samsung 4GB 1333@1866

Вне зачёта идёт платформа на Kaby Lake:
CPU: Intel I5-7600K@4500
MB: Gigabyte Z270M-D3H
RAM: 2 x DDR4 Kingston Hyper-X 16GB 2400@3200MHz

Непосредственно тестовые замеры на ней не проводились, но есть ряд наблюдений за время её эксплуатации. Там, где сравнение с ней уместно, она упоминается.

Во всех тестах также использовались:
Накопитель: NVME SSD ADATA SX8000NP
Видеокарта: Palit GeForce GTX1080Ti

Стабильность платформ проверялась последовательными 10-15минутными прогонами OCCT Large Dataset и Linpack в версии под AVX. Первый тест очень хорошо выявляет проблемы с памятью или её контроллером, второй — с цепями питания и системой охлаждения.

Методика тестирования

Тесты проводились под управлением ОС Windows 10 Pro 1803 (сборка 17134.320)

Защита от Spectre и Meltdown деактивирована на всех тестовых системах с помощью утилиты InSpectre.

Все тесты проводились по несколько раз (не менее трёх-четырёх), результат первого прогона отбрасывался, так как на результат первого прогона заметно сильнее влияют задержки ввода-вывода. Брался максимальный результат, остальные прогоны теста проводились для проверки возможных аномалий.

Тестирование

Синтетические тесты

AIDA64 memtest

Производительность и задержки памяти

СrystalDiskMark

Производительность NVME накопителя

I7 3770K, MB ASUS P8Z77-V, NVME SSD @ PCI-E 2.0 x4

E5-1650v2, HUANAN X79 2.49p, NVME SSD @ PCI-E 3.0 x4

E5-1650v2, HUANAN X79 2.49p, NVME SSD @ M2

На платформе LGA1155 пиковая производительность NVME накопителей в синтетических тестах ограничивается пропускной способностью шины PCI Express v2. На китайской материнской плате SSD заработал без ограничений интерфейса как в PCI-E слоте, так и в M2.

Рендеринг


Рендеринг, наряду с кодированием видео — это один из классов задач, которые распараллеливаются практически идеально и в теории практически линейно масштабируются при увеличении количества ядер CPU. Что собственно и подтвердили тесты.

Cinebench R15.0

Corona 1.3 benchmark

Синтетический тест игровой производительности

3D Mark Time Spy

ПО для обработки фотографий

Методика тестирования

Я взял набор снимков с пэйнтбола, снятых на старый добрый Nikon D60 в формате NEF. Всего 329 кадров. Время импорта, построения превью и прочие операции не замерялись, так как не совсем понятно, как их замерять с достаточной точностью. Измерялось время преобразования этой пачки файлов в JPEG. Время обработки задания оценивалось по разнице во времени изменения первого и последнего экспортированного JPEG-а. Не самый точный показатель, согласен, 3-5 секунд на старте процесса экспорта не учитываются, но зато легко автоматизируемый тест и не нужно постоянно сидеть и мониторить ход процесса с секундомером, как пришлось бы при попытке оценить время импорта, да и все системы при этом в равных условиях. В диск обработка точно не упиралась, исходники и папка экпорта были на SSD.

Adobe Lightroom 5.7

Результаты получились на первый взгляд довольно странные. Казалось бы процесс проявки RAW снимков должен хорошо распараллеливаться. И даже если проявка конкретного кадра не может быть раскидана на несколько ядер, в очереди обработки было более трёхсот снимков! Знай себе раскидывай каждый кадр на своё ядро. Но, судя по загрузке процессора, которая колебалась от 40% на i7 до 20% на E5-2680v2, старый Lightroom этого делать не умеет. По графику загрузки CPU видно, что больше 4 потоков он толком использовать не может, отсюда и минимальный прирост. Удивительно, что он вообще есть — скорость на поток на 10-ядернике должна быть заметно ниже разогнанного i7. В общем приложение образца 2013 года заточено максимум под двух-четырёхпоточные процессоры и не в состоянии извлечь выгоду от современных (и не очень) многопоточных процессоров.

Adobe Lightroom Classic CC (7.5)

После результатов тестов Lightroom 5.7, которые вызвали разочарование, решил проверить, как обстоят дела на актуальных версиях ПО от Adobe.

Тестирование проводилось опять же с реальными настройками. Были активированы аппаратное ускорение отрисовки UI (судя по мониторингу, Lighroom Classic поддерживает отрисовку с использованием DX12) и использование OpenCL для Adobe Camera RAW, потому что при отсутствии проблем совместимости никто в здравом уме отключать эти опции не будет, а тестирую я производительность системы в целом в тех или иных задачах.

Adobe Lightroom Classic CC показал себя намного лучше версии Lightroom образца 2013 года. Не считая того, что и на I7 свежая версия показала намного лучшую скорость, лишние пара ядер дали сокращение времени обработки пачки почти на минуту (55 секунд, если быть точными), то есть примерно на 26%. Добавка ещё в 4 ядра дала ускорение на 51 секунду или на 30%. Отлично само по себе, а если сравнить результаты i7 и E5-2680v2, то и вовсе впечатляюще. Десятиядерник справляется с задачей ровно в 2 раза быстрее, чем четырёхядерник. Масштабирование более чем линейное, если учитывать, что i7 работает на частоте 4.44GHz, а E5-2680v2 в бусте выжимает из себя 3.2GHz при нагрузке на все ядра.

Разница в поведении разных версий одного и того же приложения явно демонстрирует, что нельзя просто так взять и ускорить ПО, просто дав ему кучу ядер. ПО тоже должно быть соответствующее.

Да, новый Lightroom Classic CC хорош, но триал скоро закончится, а выкладывать каждый месяц по 900 рублей за подписку желания нет, я бы лучше разок заплатил полную сумму, но Adobe не предлагает такого варианта. Последний Lightroom, который можно было купить, а не арендовать — это шестая его версия. Но опять же, надеяться на обновление этой версии не приходится, так же как на заметные скидки при апгрейде с 5.7 на 6.х. Не интересно.

Интересно, чем его можно заменить? Nikon Capture NX? Может быть, но он у меня стабильно падал на обработке 2-3 кадра из очереди, так что провести тесты не удалось. Кажется, его поломало какое-то из последних обновлений Windows 10, но в любом случае, даже если там и есть нормальный многопоток, ожидать, что в него завезут поддержку OpenCL, бессмысленно, а без неё он обречём многократно проигрывать Lightroom Classic.

Raw Therapee? Даже не смешно. Не смотря на богатые функциональные возможности, пользоваться этим чудом Open Source, которого явно не касалась рука UX-дизайнера, приходилось себя заставлять. Зависнуть при клике на папку и не отвечать секунд 15 без какой-либо индикации процесса? Время обработки, в разы превышающее даже Lightroom 5.7 (замер сделать не удалось, минут за 5 Raw Therapee кое как прожевал где-то треть пачки, и мне надоело ждать)? Это норма. Наверное. Для кого-нибудь. Может быть. Но я лучше заплачу за адекватный интерфейс и нормальную скорость работы. Что там у нас есть из платных аналогов, работающего под Windows? Кто ещё производит графическое ПО?

Corel AfterShot Pro 3

Corel с его Corel AfterShot Pro 3. Да ещё с заявками на победу вида «Corel AfterShot Pro 3 is up to 4x faster than Adobe Lightroom». Уже интересно.

С учетверенной относительно Lightroom скоростью Corel, конечно, загнул, но на I7-3770K Corel AfetrShot Pro 3 отыгрывает у Adobe Lightroom CC примерно 84 секунды из 211 или 40%. На E5-1650v2 никаким четырёхкратным превосходством над Lightroom-ом тоже пахнет, более того, разрыв сократился, но 36 секунд или 24% на 300+ снимках он отыграл. А вот на 20 потоках меня ждал неприятный сюрприз — время обработки пачки увеличилось в полтора раза по сравнению с 12 потоками. WTF?! А если отключить HT? На 10 потоках он вполне нормально работает, заканчивает на пол минуты быстрее, чем на шестиядернике. А если просто руками установить ограничение на количество потоков, а HT на процессоре включить обратно? А примерно так же работает. То есть AfterShot Pro на количестве потоков более 10 начинает на ровном месте дико тупить. Ну, тоже результат. Очередное доказательство, что для того, чтобы многоядерные CPU могли себя проявить, им требуется соответствующее ПО. А Corel AfetrShot Pro 3 явно затачивался под 4-8 потоков.

Игры

Выбор в основном обусловлен не репрезентативностью выборки, а тем, что было под рукой из тех игр, в которых есть встроенные бенчмарки, позволяющие получать более менее стабильные и повторяемые результаты. Но какая-никакая логика прослеживается.

Методика тестирования

Настройки во всех играх максимальные за исключением настроек антиалиасинга. AA отключен, чтобы не упираться в лимит fillrate. В зачёт шёл минимальный усреднённый FPS как основной показатель комфортности игрового процесса на тестируемом железе с максимальными настройками. Показатель «очень редких событий», 0.1% min fps, всё же является больше индикатором случайных событий, и если микрофризы не идут сплошным потоком раз в несколько секунд, то на комфорт игры он, как мне кажется, влияет не особо. Естественно, график фреймтайма я проверял, и если у игры действительно возникали проблемы с микрофризами, то они фиксировались. Результаты замеров брались из встроенного бенчмарка игры, если бенчмарк не позволяет получить в явном виде статистику, как в GTA V, использовался Riva Tuner Statics Server для фиксации параметров производительности.

GTA V

Относительно немолодая мультиплатформенная игра, на Windows использует графическое API DX11. Так как выходила на приставках, с поддержкой многопоточности у неё все довольно неплохо, а требования к производительности ядер умеренные, тк игра поддерживает приставки прошлого поколения. Так как тест не умеет выдавать статистику, для сбора результатов тестирования использовался Riva Tuner Statistics Server. Для того, чтобы усложнить процессору задачу, были включены опции увеличения дальности детализации и отрисовки теней.

скриншоты настроек игры для теста

результаты тестов

I7-3770K 22-09-2018, 18:58:21 GTA5.exe benchmark completed, 8234 frames rendered in 115.485 s                      Average framerate  :   71.2 FPS                      Minimum framerate  :   45.3 FPS                      Maximum framerate  :  269.9 FPS                      1% low framerate   :   46.3 FPS                      0.1% low framerate :   39.4 FPS  E5-1650V2 23-09-2018, 20:50:08 GTA5.exe benchmark completed, 7862 frames rendered in 116.125 s                      Average framerate  :   67.7 FPS                      Minimum framerate  :   48.1 FPS                      Maximum framerate  :  119.2 FPS                      1% low framerate   :   47.3 FPS                      0.1% low framerate :   43.0 FPS  E5-2680v2 23-09-2018, 22:48:25 GTA5.exe benchmark completed, 7618 frames rendered in 116.313 s                      Average framerate  :   65.4 FPS                      Minimum framerate  :   47.7 FPS                      Maximum framerate  :  154.8 FPS                      1% low framerate   :   46.7 FPS                      0.1% low framerate :   40.5 FPS 

Far Cry 5

Мультиплатформенная игра этого года, на PC опять же работает под DX11. Ориентирована на PC и приставки последнего поколения. Многопоточность имеется, но любит быстрые ядра и почему-то HyperThreading. По крайней мере при его деактивации на платформе E5-2680v2 фреймтайм в тесте при наличии упора в CPU становился очень дёрганным с непонятными просадками в произвольных местах, начинались фризы раз в 5-6 секунд в тестовом отрезке. Если снять упор с CPU, подняв разрешение рендеринга, игра при снижении среднего FPS демонстрировала заметно более комфортный игровой процесс за счёт отсутствия микрофризов и рывков. Показатели среднего и минимального FPS при этом не менялись. После выхода последнего патча с HD текстурами я перетестировал игру на двух конфигурация, и не обнаружил вообще никакой разницы в производительности. Да, потребление VRAM возрастает с 2.4 до 4.6 гигабайт, но для 11-гиговой 1080Ti нагрузку это не меняет.

скриншоты настроек игры для теста

скриншоты результатов тестовых прогонов

I7 3770K@4444

E5-1650v2@4000

E5-2680v2

Deus Ex Mankind Divided

Единственная игра, формально поддерживающая DX12. Тестировалась именно в этом режиме, не смотря на абсолютную его бессмысленность. В теории DX12 должен снижать процессорозависимость. На практике ничего, кроме снижения FPS на 15-20 кадров в секунду он не приносит, ни на йоту не изменяя графику в игре. Несколько искусственный тест получился, но так вышло.

скриншоты настроек игры для теста

скриншоты результатов тестовых прогонов

I7 3770K@4444

E5-1650v2@4000

E5-2680v2

Остальные игры пошли вне зачёта, тк повторяемость показательных игровых отрезков на них околонулевая, но общая тенденция имеется, хоть и выразить её в точных цифрах минимального FPS не получается.

Вне зачёта

Игры на id tech 6. Doom, Wolfenstein New Colossus

Игровой движок от ID Software порадовал. ID Tech 6 при использовании API Vulcan обеспечивает утилизацию всех ядер CPU, до которых может дотянуться. На E5-2680v2 нагрузка равномерно распределялась на все 20 потоков, чего не мог обеспечить никакой другой движок в тестах. В Doom счётчик кадров упёрся во вшитый лимит в 200 кадров в секунду на максимальных настройках на всех CPU.

Wolfenstein New Colossus демонстрирует с одной стороны похожее поведение — он способен с пользой использовать 20 потоков, с другой — в нём нет вшитого лимита на 200 кадров в секунду и более сложная графика, в результате чего результаты стали отличаться: FPS колеблется от 170 до 230 на обоих Xeon-ах. На I7 разброс показателей больше – от 150 до 270. Минимальный FPS в сценах с кучей геометрии ниже, но там, где он упирается в скорость на ядро – FPS улетает в небеса. В целом все процессоры обеспечили одинаково комфортную игру. Отличить на глаз 150 минимальных FPS от 170 сложновато.

Cities Skylines

Классическая полуторопоточная игра с нулевой оптимизацией под современные реалии. Ей не нужно ничего кроме пары быстрых ядер, поэтому показатели этой игры на E5-2680v2 удручили. FPS дропается ниже 25, симуляция дёргается, всё плохо. На E5-1650v2@4100 всё более или менее, FPS в районе 30, на I7-3770K@4444 в районе 35-40 при максимальном приближении и крупном городе. I5-7600K со стабильными 50-60 FPS вне досягаемости.

Однопоточная дичь: DosBox + Carmageddon + nGlide

Суровая однопоточная нагрузка, двойная эмуляция, всё как мы любим. Единственный тип нагрузки, который вызвал проблемы при попытке запуска на сбалансированной схеме электропитания на Xeon-ах. С одной стороны, нагрузка сугубо однопоточная, с другой стороны, как бы я не крутил настройки, загрузить ядро целиком, хоть с активированным HT, хоть без него, DosBox не в состоянии, в результате чего не включается boost и частота болтается в диапазона от 1.2 до 3.5 GHz, и всё жутко тупит и дёргается. В чём проблема, разобраться так и не удалось.

Лучше всего это видно на видео:

Тестовый отрезок классического Carmageddon

Лечится включением производительного плана питания, но всё равно загрузка ядра никогда не превышает 70-80%, про загрузку видеокарты и говорить смешно — в таком режиме нет вообще никакой разницы в производительности на интеловской встройке и на GTX1080Ti, но FPS плавает и проседает.

Минимальный FPS временами падает ниже 30 на всех системах, но на E5-2680v2 он временами проваливается ниже 20. I7 заметно превосходит E5-1650v2 в комфорте – ниже 25 частота кадров не проседает, нет микрофризов, средний FPS выше на 5-7 кадров в секунду. E5-1650v2 где-то посередине. I5-7600K@4500 опять же недостижим.

Сводные результаты тестов

Ед. изм. I7-3770K E5-1650V2 E5-2680V2
Lightroom 5.7 sec 393 372 347
Lightroom 7.5 sec 221 156 105
Corel AfterShot Pro3 sec 127 118 94
Corona 1.3 1000 rays/sec 1 848 2 433 3 339
CineBench R15 points 817 1 062 1 386
Memory Read MB/s 31 872 50 143 55 275
Memory Write MB/s 33 072 36 202 47 102
Memory Copy MB/s 29 932 48 249 50 877
Memory Latency ns 46,90 75,20 75,30
3DMark Timespy. Overall score points 8 364 8 842 9 152
3DMark Timespy. Graphics Score points 9 756 9 588 9 469
3DMark Timespy. Graphis Test 1 fps 62,60 61,72 60,88
3DMark Timespy. Graphis Test 2 fps 56,72 55,58 54,96
3DMark Timespy. CPU Score points 4 626 6 137 7 697
3DMark Timespy. CPU Test fps 15,54 20,62 25,86
Far Cry 5. Minimum FPS fps 66 65 60
Far Cry 5. Average FPS fps 89 89 82
Far Cry 5. Maximum FPS fps 120 124 115
Deus Ex: Mankind Divided, minimum fps 62,50 62,50 53,10
Deus Ex: Mankind Divided, average fps 85,50 84,50 73,20
Deus Ex: Mankind Divided, maximum fps 122,00 122,00 105,30
GTA V Average framerate fps 71,60 67,70 65,40
GTA V min framerate fps 47,10 48,80 48,10
GTA V 1% low framerate fps 46,30 47,30 46,70
GTA V 0.1% low framerate fps 39,40 43,00 40,50

Выводы

Выводы в принципе ожидаемые. Оба зиона показали себя довольно неплохо, но не без ньюансов.

E5-2680v2 ожидаемо отлично себя показал в оптимизированных под многопоточные CPU приложениях и неплохо в относительно современных играх при условии их оптимизации под многоядерные CPU. Не смотря на то, что он всё же уступил более высокочастотным процессорам в играх, тем не игры последних двух-трёх лет на максималках всё ещё играбельны, а в рабочих приложениях конкурентов он просто разорвал. Ещё одним достоинством этого процессора является то, что он холодный. Ни в одном тесте его температура не превышала 50 градусов, при том, что вентилятор кулера работал на минимальных оборотах и даже и не думал раскручиваться.

E5-1650v2 в разгоне показал себя наиболее универсальным процессором. Незначительно уступая обычным десктопным моделям в играх, он достаточно серьёзно превосходит их при работе с видео и графикой. Но и потребляет он изрядно, и греется сам и греет цепи питания от души.

I7-3770K. Не смотря на внушительный возраст, в разгоне этот процессор и по сей день заметно превосходит прошлогодние камни в стоке за эту же цену. Да и в разгоне в половине случаев тоже. В большинстве случаев он обеспечивает примерно такую же или большую игровую производительность, а работать на нём заметно комфортнее, чем на том же I5-7600K. Превосходство в цифрах не поражает, но отзывчивость системы под нагрузкой на старом I7 куда выше, чем на современном четырёхядернике (теперь ближайший аналог — это I3-8400).

По ощущениям, наиболее универсальным вариантом под платформу LGA2011v2 должны быть восьмиядерные Xeon-ы E5-2667v2 и E5-2687Wv2 c достаточно высокой частотой ядер в бусте, так как Xeon E5-2680v2 в некоторых сценариях явно упирался в скорость на поток, но это ещё 4-8 тысяч рублей сверху к его цене, что делает целосообразность использования такой конфигурации весьма сомнительной. С другой стороны, тот же E5-2680v2 за сравнительно небольшие деньги позволяет собрать двадцатиядерную и сорокапоточную систему с большим объёмом оперативной памяти, но в этом случае нужно чётко понимать цели, для которых собирается такой монстр (например как здесь: ilipin.livejournal.com/161378.html).

PS: и да… китайская материнка прожила ровно столько, чтобы успеть снять тесты. При очередной неудачной попытке разгона E5-1650v2 она зависла под OCCT и больше не загрузилась. В качестве основной системы она проработала недели 3, проблем с ней в качестве платформы для рабочей станции не было вообще. Китайцам предъявлять претензии в данном случае странно, всё же разгон – это не беспроигрышная лотерея, и железо временами страдает.


ссылка на оригинал статьи https://habr.com/post/426317/

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *