Последние пять десятилетий развития полупроводников в значительной степени определялись законом Мура, то есть идеей о том, что количество транзисторов в интегральной схеме будет удваиваться примерно каждые два года, и что связанный с этим рост затрат будет минимальным. Хотя закон Мура, возможно, уже исчерпал возможный потенциал, но выгоды, полученные в результате развития IT-отрасли были колоссальными. Благодаря усилиям производителей и конкуренции между ними, у людей теперь есть процессоры, которые почти на пять порядков производительнее, чем те, что были два десятилетия назад. Недостатком является то, что выигрыш в обработке намного опередил достижения в других критических компонентах, таких как скорость передачи данных между чипами.
Когда Марку Кюмерле, вице-президенту по технологиям в компании-производителе полупроводников Marvell, нужно было познакомить нескольких новых инженеров с одной из проблем, возникших в отрасли, он одолжил у своих детей кучу блоков LEGO. Он представил группе некоторое количество несовпадающих блоков и объяснил своим новым ученикам, что эти детали должны были представлять разные чипы с определёнными функциями.
Традиционно все критические компоненты полупроводника были упакованы на одной пластине кремния — этот подход называется однородной интеграцией. Упражнение, предложенное Кюмерле, отражало стратегию проектирования, называемую гетерогенной интеграцией, которая объединяет различные чипы, известные как чиплеты, с их собственными специфическими функциями, которые могут различаться не только с точки зрения того, для чего они предназначены, но также по размеру и спецификациям. Например, чип памяти может быть относительно небольшим, а чип, предназначенный для задач машинного обучения, — гораздо больше.
Задание, которое было поставлено перед инженерами, состояло в том, чтобы соединить различные игрушечные детали вместе, как будто это были настоящие чиплеты, которым нужно было передавать данные и общаться друг с другом на максимально коротких расстояниях. Сложность задачи была сразу же очевидна, так как люди брали блоки и пытаясь соединить, сжимали их вместе, сгибали, надстраивали… но, в итоге, это оказалось очень сложной геометрической задачей. Тем не менее, потенциальные преимущества подхода на основе чиплетов делают эту и другие проблемы стоящими решения. Возможность размещать чиплеты ближе друг к другу ускоряет передачу данных и производительность. Такой подход более экономичен, поскольку гораздо меньше вероятность того, что дефект погубит весь пакет. Смешивание и сопоставление элементов с различными возможностями также позволяет разработчикам оптимизировать пакеты для определённых функций или вариантов использования.
Можно объединить отдельные чипы, которые могут быть очень, очень разными. У разработки могут быть высокопроизводительные процессоры, передовая память, датчики, фотонные технологии, миниатюрные медицинские лаборатории на чипе — всё на одной платформе. Новейшие чипы для машинного обучения впечатляют, но они дороги и требуют много времени на проектирование. Используя подход чиплетов, появляется возможность интегрировать различные компоненты в одну платформу, что позволяет использовать конфигурацию plug-and-play и потенциально превосходит современные показатели производительности.
Сегодня экономика также стала сложнее. Стоимость транзистора снижалась в течение последних пяти десятилетий от одного поколения компьютеров к другому, но сейчас уже достигает точки перегиба. Когда разработчики переходят к очень продвинутым узлам и начинают создавать эти более крупные и сложные чипы, капитальные затраты, необходимые для получения таких крошечных транзисторов, очень высоки. Это, в свою очередь, приводит к более высокому риску. Одной из наиболее важных переменных в экономике производства полупроводников является выход годных, или процент успешно изготовленных процессоров. Один дефект в одном из компонентов стандартного кремниевого чипа может погубить весь пакет, поскольку эти отдельные части не могут быть эффективно заменены. Благодаря своей модульной природе система, состоящая из нескольких чиплетов, может похвастаться более высоким выходом годных и, следовательно, лучшей экономикой. Дефект в одном компоненте не обязательно приведёт к потере всего набора.
Сам Мур предвидел эту возможность в своей оригинальной статье 1965 года, отмечая: «Может оказаться более экономичным строить большие системы из меньших функций, которые упакованы отдельно и взаимосвязаны». Аналитики отрасли объясняют, что чиплеты привлекательны даже с точки зрения доходности, так как это своего рода поддержание закона Мура в силе, поскольку в будущем производители по-прежнему будут получать большую отдачу от своих вложений.
Стандартизация связи на основе чиплетов
Общая идея чиплетов существовала десятилетиями (ранние вариации были ещё в 1990-х годах). Разница была в том, что эти массивные многочиповые модули были сделаны из компонентов одного производителя. Сегодня компоненты могут поставляться разными поставщиками. Они имеют разные размеры, и у них не обязательно есть одинаковые стандартизированные интерфейсы для «общения» между собой и внешними устройствами. Устранение этого коммуникационного разрыва — одна из следующих глобальных задач для отрасли. Это как использовать набор одних и тех же букв алфавита, но кто-то будет ими писать по-французски, а кто-то по-английски. Если разработчики дойдут до того, что отрасль сможет научить выпускаемые компоненты «общаться» со всеми другими, то эти и разработчики смогут яснее понимать, какую работу они пытаются выполнить и как помочь друг другу. На этом направлении несколько лидеров отрасли теперь поддерживают открытый стандарт связи, Universal Chiplet Interconnect Express (UCIe), чтобы помочь формализовать способ передачи информации чиплетами.
Производительность и геополитика
Как только эта проблема коммуникации будет решена, появится потенциал для значительного повышения производительности. Это произойдёт отчасти потому, что если будет решена проблема геометрии, то появится реальная возможность расположить ключевые компоненты близко друг к другу. Ведь сантиметр действительно имеет значение, когда речь идёт о терабайтах данных, передающихся в секунду. Чиплеты обеспечивают более быструю передачу информационных потоков в дуплексном режиме, потому что можно расположить ключевые точки физически близко друг к другу. При больших объёмах это становится критически важным.
Компании также работают над улучшением физических взаимосвязей между чиплетами в пакете. Но одна из проблем стандартной конструкции чипа заключается в том, что связь между вычислениями и памятью не оптимизирована. Из-за закона Мура есть процессоры, которые могут обрабатывать данные в 90 000 раз быстрее, но пропускная способность между этими чипами и узлами памяти увеличилась в лучшем случае только в 100 раз. Чтобы устранить этот пробел, компании разрабатывают технологию межпроцессорных соединений, которая работает как в стандартном режиме, совместимом с UCIe, так и в режиме одновременной двунаправленной передачи (SBD), ускоряя передачу данных в два раза в обоих направлениях. Например, увеличенная пропускная способность и более быстрое взаимодействие позволят процессорам ИИ быстрее получать доступ к памяти.
Спрос на технологии, которые могут управлять рабочими нагрузками для искусственного интеллекта, сейчас весьма огромный. Даже некоторые стартапы, «заточенные» под изобретение новых полупроводниковых архитектур становятся пионерами в области оптической связи, так как им удалось разработать способы для ускорения передачи данных между полупроводниковыми пакетами или стойками с серверами в дата-центрах, распределёнными на гораздо больших расстояниях. Технологии разрабатываются в соответствии со стандартом UCIe и работают с различными чиплетами, но уже многие фокусируются на специализации для ИИ. Ускорительные чипы, на которые сегодня полагаются ведущие компании машинного обучения, должны работать в унисон — ведь рабочие нагрузки распределяются по десяткам тысяч чипов одновременно. Для этого разрабатываются новейшие шины передачи данных – например, оптический чиплет ввода-вывода TeraPHY от Ayar Labs увеличивает пропускную способность между ними, соединяя сотни и тысячи вычислительных пакетов вместе, чтобы они оказались напрямую взаимосвязанными и вели себя, как один многозадачный виртуальный чип.
Приложения ИИ и общий потенциал для улучшения производительности сделали чиплеты областью геополитических интересов. США ограничили доступ Китаю к некоторым передовым технологиям в данной области. Но если конструкции на основе чиплетов появятся на рынке, то не исключено, что другие страны могут найти подходящие обходные пути для получения технологии производства и заимствования лучших идей. К тому же сейчас разрабатывается новая вертикальная архитектура чиплетов, отчасти для снижения потерь мощности. Ожидается, что вливание исследовательского финансирования из программы NAPMP стоимостью 3 миллиарда долларов приведёт к значительному прогрессу в академической среде на этом направлении. Как университетские исследователи, так и промышленность будут играть важную роль в продвижении этих новых подходов к «упаковыванию» процессоров в многомерный форм-фактор и формировании отрасли в предстоящие годы. Раньше производителям ещё было куда двигаться, так как ситуация, работавшая по закону Мура, ещё не ставила таких жёстких ограничений. Теперь ограничения появились, а значит люди начали пробовать новые подходы для дальнейшего развития технологии. Но у разработчиков появились «дорожные карты», которые дают им представление о тех показателях, к которым они должны стремиться, применяя технический подход к решению возникающих проблем.