Анализ снимка кристалла и архитектуры Apple M2

от автора

image

На конференции WWDC компания Apple объявила о выпуске нового SoC M2 из 20 миллиардов транзисторов. К сожалению, в некоторых областях, например, для центрального процессора, это довольно незначительный рост. В основном увеличение производительности связано с GPU и редактированием видео. В целом рост производительности немного разочаровывает, если учесть затраты на новый M2 и то, что после выпуска M1 прошло уже почти два года. История с повышением цены похожа на ситуацию с A16, когда Apple была вынуждена использовать SoC A16 на моделях iPhone Pro и A15 на обычных iPhone из-за стоимости комплектующих.

Сегодня мы обсудим подробности архитектуры M2 и будущие проекты Apple, в том числе M2 Pro/Max и M3, о которых не говорили на WWDC. Также благодаря помощи пользователя Locuza мы проведём анализ площади кристалла по снимкам M2, опубликованным Apple.

Очень странно видеть, что некоторые специалисты называют новый продукт M1.5 или M1+. Это просто чушь. В целом M1 создан на основе тех же IP-блоков, что и Apple A14 (с небольшими изменениями). M2, имеющий кодовое название Staten, основан на тех же IP-блоках, что и A15 (кодовое название Ellis). Кодовые названия взяты у самых известных островов Нью-Йорка, поэтому намекают о тесной взаимосвязи этих архитектур. Разочарование незначительным ростом производительности при переходе на новое поколение вызвано тем, что после выпуска M1 пришлось ждать два года. Многие люди ожидали от M2 большего.

Мы уже говорили об этом в прошлом: во многом замедление развития связано с тем, что многие потрясающие инженеры Apple уходят в такие компании, как Nuvia и Rivos. Утечка мозгов за последние годы не прекратилась из-за не самой лучшей корпоративной культуры Apple; к тому же многие компании, в частности, такие гиперскейлеры, как Google, Microsoft, Amazon и Meta, платят больше, чем платила Apple за привлечение сотрудников. Наконец, произошёл исход из компании мотивированных инженеров, считающих, что им успешно удалось выполнить переход Apple с процессоров Intel на собственные. Эти инженеры ушли, потому что захотели работать над более интересными проектами в компаниях-гиперскейлерах или в традиционных фирмах.

Эти увольнения привели к тому, что в A15 и M2, а также, возможно, в следующем чипе A16, рост производительности ЦП будет более умеренным. Мы слышали, что в A16 не используется ядро нового поколения на основе Armv9; печально, если это так, ведь Apple первой использовала Armv8. Мы слышали, что это ядро Armv9 нового поколения появится только в M3, который станет первым продуктом Apple на техпроцессе N3 TSMC. Apple уже спроектировала и передала в производство M2 Pro и M2 Max, в которых по-прежнему используются N5 и IP-блоки A15.

Давайте исследуем снимок. Apple опубликовала снимок M1 и M2, не имеющий никаких пометок. Из него следует, что M2 имеет площадь 141,7 мм2, но мы считаем, что Apple подредактировала снимок кристалла. Такое происходит не впервые. Apple так же поступила с M1 Max, скрыв соединения между кристаллами, использованное в M1 Ultra. Ещё компания сместила геометрические размеры.

Снимок M2, кажется, тоже сделан не в масштабе. Можно сравнить ячейки SRAM и PHY, которые должны быть одинаковыми у всех чипов, и увидеть, что M2 кажется меньше, чем он должен быть. Кроме того, представленный Apple M2, похоже, имеет бОльшую, чем у A15, плотность транзисторов, что тоже выглядит несоответствием. Он должен иметь меньшую плотность из-за меньшей общей площади, выделенной на ячейки SRAM высокой плотности, и большей площади, выделенной для ввода-вывода и прочей логики. Поэтому Locuza изменил масштаб снимка кристалла M2. После масштабирования ячейки SRAM и идентичные PHY стали эквивалентны по размерам этим элементам на M1 и A15. Из-за обработки маркетингового изображения Apple после масштабирования кристалла появился диапазон погрешностей примерно в 3%. Значения в статье представлены так, как они были измерены, без учёта величин погрешностей.

Давайте теперь разберёмся, как Apple использовала увеличившуюся площадь кристалла.

Начнём с P-Core Apple. Оно создано на основе ядра Avalanche Apple, использовавшегося в A15, однако присутствуют небольшие отличия. Это соответствует подходу, использованному в M1 Pro и M1 Max: в них применялось модифицированное ядро Firestorm, способное справляться с бОльшими объёмами памяти благодаря расширенной адресации страниц. В ядра на основе M также внесено несколько модификаций, помогающих в работе со страницами разного размера, которые должны поддерживаться в MacOS.

Само ядро на 21% больше по площади, чем ядро M1, и на 7% больше, чем у A15. Большая часть увеличения площади кристалла между поколениями связана с размером общего кэша L2, выросшим с 12 МБ до 16 МБ. Блок AMX выглядит одинаковым с A15 и M1. Слой совместно используемой логики тоже стал существенно больше, это является показателем того, что полоса пропускания между ядрами, кэшем L2 и SLC стала шире. Суммарно Apple выделила 5,2 мм2 на большие P-Core, однако связанный с ними рост производительности в основном вызван увеличением тактовых частот. Судя по обзорам, увеличение количества инструкций на такт (IPC) достаточно незначительно.

Очень интересное изменение заключается в том, что ROB в ядре Avalanche, используемом в A15 и M2, стал меньше по сравнению с ROB (Re-order Buffer, переупорядочивающим буфером) ядра Firestorm, применяемого в M1 и A14. Это особенно интересно, потому что Apple использует самый крупный ROB в отрасли, чтобы обеспечить ядро самым широким и высоким количеством инструкций на такт в отрасли.

При переходе от A14 к A15 самым большим изменением с точки зрения центрального процессора стало E-Core; здесь ситуация такая же. После масштабирования опубликованного Apple снимка кристалла видно, что ядра E-Core между A15 и M2 выглядят практически идентично, и это хороший признак того, что масштаб подобран правильно. Apple не вносила или почти не вносила изменений в E-Core для процессоров Mac по сравнению с изменениями и новым физическим дизайном ядер P-Core.

Про E-Core сказать особо нечего, поскольку достаточно очевидно, что оно ничем не отличается от E-Core A15, который уже тщательно протестирован. В целом комплекс E-Core лишь на 1 мм2 больше по сравнению с предыдущим поколением, при том, что весь комплекс ЦП больше на 6,2 мм2.

После масштабирования GPU тоже стало похоже, что он имеет примерно такой же размер ядер, в сравнении с M1 и его 128 АЛУ. Это очень интересно, потому что это один из тех аспектов, в которых M1 отличался от A14. Это было архитектурное изменение, несмотря на то, что оба этих процессора относятся к одному поколению. У Apple уже был прецедент с SoC X, в котором появились изменения по сравнению с SoC A. Например, много лет назад A6 и A6X имели разные архитектуры GPU. Учитывая, что SoC серии M — это просто ребрендированная серия X, это логично. Текущее поколение ядра GPU, кажется, осталось неизменным, однако совместно используемая логика и прочие элементы стали больше, поэтому можно предположить, что есть изменения в аспектах фиксированной функциональности. Основным отличием стало количество ядер, Apple увеличила его до десяти. Отдельно можно упомянуть тактовую частоту GPU, выросшую с 1,27 ГГц до 1,406 ГГц.

По сравнению с предыдущим поколением новый GPU увеличился почти на 7 мм2. Это приличный рост производительности, хоть Apple и заявила, что при максимальном уровне производительности энергопотребление немного увеличивается. Однако при том же уровне энергопотребления Apple всё равно получила неплохое повышение производительности из-за улучшения памяти и более широкого/медленного дизайна. Мы также добавили в график показатели NPU и SLC. Показатели NPU кажутся немного странными, поэтому их мы пропустим. А вот с SLC всё любопытно.

Каждый массив данных на 2 МБ одинаков по размерам у M1, A15 и отмасштабированного снимка кристалла M2, что логично и оправдывает то, что мы масштабировали его, подгоняя под одинаковый размер PHY. При переходе от первого ко второму поколению техпроцесса N5 размер SRAM не уменьшился. Несмотря на это, SLC немного выросла в размерах; скорее всего, увеличили пропускную способность различных IP-блоков, например, выросшего в размерах GPU.

Последний IP-блок, который нужно сравнить — это контроллер памяти + PHY. Здесь Apple существенно увеличила площадь для поддержки LPDDR5 6400. На изображении выше показан один блок, но, разумеется, контроллер памяти имеет много каналов. Общая площадь, выделенная 128-битной шине LP5, примерно равна 14 мм2 по сравнению с 8,1 мм2 на M1 с его 128-битной LP4X и 4,3 мм2 на A15 с 64-битной LP4X. С точки зрения затрат стоит заметить, что LPDDR5 6400 существенно дороже LPDDR4X 4266.

Это тоже важный аспект для Apple, которая собирается разделить линейку A15 и A16 в iPhone этого года. Мы писали об этом решении здесь. В целом, Apple придётся столкнуться с подобными проблемами и у M2, именно поэтому компания оставляет модели на основе M1 для нижнего ценового диапазона. Сочетание небольшого повышения стоимости кремниевых пластин, увеличения площади кристалла с 118,91 мм2 до 155,25 мм2 и более дорогой памяти сильно мешает компании.

Последний IP-блок, который мы не проанализировали — это сильно увеличившийся медиадвижок, обеспечивающий расширенные возможности работы с медиа. Серия Apple M, несомненно, является лучшей SoC для творческих работников, и с этим вопросов нет. Если вы работаете с пакетом Adobe, то серия M подойдёт вам больше всего.


ссылка на оригинал статьи https://habr.com/ru/post/670908/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *