IBM заявила о прорыве в обучении ИИ с помощью оптики

от автора

IBM разработала новую оптическую технологию для обучения моделей искусственного интеллекта со скоростью света, при этом экономя энергию. Компания заявила, что благодаря применению технологии в центрах обработки данных можно сэкономить эквивалент годового энергопотребления 5 тыс. домохозяйств США.

Компания объяснила, что, хотя ЦОД подключаются к внешнему миру с помощью оптоволоконных кабелей, внутри них по-прежнему используются медные провода. Они соединяют ускорители графических процессоров, у которых много времени уходит на работу в режиме ожидания данных от других устройств, что приводит к расходу энергии.

Старший вице-президент и директор по исследованиям IBM Дарио Джил рассказал: «Поскольку генеративный ИИ требует больше энергии и вычислительной мощности, центры обработки данных должны развиваться — и ко-пакетная оптика может сделать их перспективными. Благодаря этому прорыву чипы будущего будут взаимодействовать подобно оптоволоконным кабелям, которые передают данные в центры обработки данных и обратно, открывая новую эру более быстрой и устойчивой связи, которая может справиться с рабочими нагрузками ИИ будущего».

IBM описывает свой новый прототип ко-пакетной оптики (CPO) в техническом документе. Значительно увеличив пропускную способность в центрах обработки данных, можно свести к минимуму время простоя графического процессора, что ускорит обработку задач ИИ.

Компания напомнила об инновациях, которые позволили более плотно размещать транзисторы на чипе; так, технология чипов IBM с 2-нанометровым узлом может содержать более 50 млрд транзисторов. CPO же позволяет масштабировать плотность взаимосвязей между ускорителями, позволяя производителям чипов добавлять оптические пути, соединяющие чипы на электронном модуле за пределами существующих ограничений. Новые оптические структуры с высокой плотностью пропускной способности в сочетании с передачей нескольких длин волн на оптический канал могут увеличить пропускную способность между чипами в 80 раз по сравнению с электрическими соединениями. Это позволит производителям микросхем добавлять в шесть раз больше оптических волокон на краю кремниевого фотонного чипа. Каждое волокно, примерно в три раза шире человеческого волоса, может охватывать от сантиметров до сотен метров в длину и передавать терабиты данных в секунду. Команда IBM собрала высокоплотный PWG с шагом оптических каналов 50 микрометров, адиабатически связанный с кремниевыми фотонными волноводами, используя стандартные процессы сборки и упаковки.

Модули CPO с PWG с шагом 50 микрометров стали первыми, которые прошли все стресс-тесты, необходимые для производства. Компоненты подвергались воздействию высокой влажности и температур в диапазоне от -40°C до 125°C, а также испытаниям на механическую прочность. Также исследователи продемонстрировали технологию PWG с шагом 18 микрометров. Объединение четырёх PWG позволит обеспечить до 128 каналов для подключения на этом шаге.

Разработав и собрав первый успешный полимерный оптический волновод (PWG) для питания этой технологии, исследователи IBM показали, как он меняет способ передачи данных с высокой пропускной способностью между чипами, печатными платами и серверами. Компания объясняет, что обучение больших языковых моделей можно сократить с трёх месяцев до трёх недель. В то же время повышение энергоэффективности сократит потребление энергии и снизит затраты, связанные с этим процессом.


ссылка на оригинал статьи https://habr.com/ru/articles/865936/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *