ИИ-чипы в 2024 году: на что Сэм Альтман предлагает тратить триллионы
Искусственный интеллект уже становится неотъемлемой частью большинства сфер деятельности. Наряду с совершенствованием алгоритмов, ключевую роль в развитии этой области играют аппаратные средства, в частности специализированные чипы.
Успех современных методов ИИ зависит от масштабных вычислений, невозможных еще несколько лет назад. Обучение передовых алгоритмов может занимать месяцы и стоить десятки миллионов долларов.
Такая колоссальная вычислительная мощность обеспечивается специализированными чипами с максимальным количеством транзисторов, разрабатываемых для эффективных вычислений, которые требуются системам ИИ.
В этой статье мы рассмотрим историю, принципы работы и распространения чипов для ИИ, их преимущества в плане производительности и энергоэффективности по сравнению с предыдущими поколениями и чипами общего назначения. Также расскажем о тенденции развития полупроводниковой промышленности и дизайна чипов, определяющей эволюцию полупроводников в целом.
Под термином «ИИ-чипы» подразумеваются специальные компьютерные чипы, достигающие высокой эффективности и скорости для вычислений в ущерб производительности при других типах вычислений.
- Специализированные чипы для ИИ обеспечивают высокую производительность и энергоэффективность по сравнению с процессорами общего назначения.
- Ведущие компании вроде NVIDIA, Intel, AMD, Microsoft, Amazon и Google активно инвестируют в разработку специализированных ИИ-чипов.
- Внедрение передовых технологических процессов позволит создавать более миниатюрные, производительные и энергоэффективные ИИ-чипы.
- ИИ-чипы начинают внедряться в потребительскую электронику вроде смартфонов и ПК для выполнения задач искусственного интеллекта непосредственно на устройствах пользователя.
Индустрия предпочитает ИИ-чипы
В период с 1960-х по 2010-е годы инженерные инновации по уменьшению размеров транзисторов позволяли удваивать их количество на одном чипе примерно каждые два года — явление, известное как закон Мура. Благодаря этому производительность и энергоэффективность процессоров возросли в миллионы раз.
Однако сегодня ширина транзисторов составляет всего несколько атомов. Их дальнейшее уменьшение создает крайне сложные инженерные задачи, ведущие к резкому росту капитальных затрат и стоимости высококвалифицированных кадров в полупроводниковой отрасли.
Вследствие этого темпы действия закона Мура замедляются, увеличивая время, необходимое для удвоения плотности транзисторов. Тем не менее продолжение работы в этом направлении оправданно, поскольку позволяет постоянно совершенствовать их эффективность и быстродействие, а также интегрировать больше специализированных схем в одну микросхему.
Исторически эффект масштабирования благоприятствовал чипам общего назначения, таким как центральные процессоры. Однако рост спроса на специализированные решения, в частности для ИИ, нарушил этот тренд. В результате специализированные чипы для ИИ теперь отвоевывают долю рынка у универсальных процессоров.
Основы чипов для искусственного интеллекта
К чипам для ИИ относятся:
- графические процессоры (GPU);
- программируемые вентильные матрицы (FPGA);
- специализированные интегральные схемы (ASIC) для ИИ.
Центральные процессоры (CPU) общего назначения также могут использоваться для решения некоторых простых задач ИИ. Однако по мере развития технологий их применение становится менее эффективным.
Подобно процессорам общего назначения, чипы для ИИ повышают скорость и энергоэффективность за счет использования большого количества все более миниатюрных транзисторов. Но, в отличие от CPU, специализированные микросхемы имеют дополнительные конструктивные особенности, оптимизированные специально для задач искусственного интеллекта.
Эти особенности значительно ускоряют повторяющиеся, предсказуемые и независимые вычисления, необходимые алгоритмам ИИ. Они включают:
- параллельное, а не последовательное выполнение большого числа вычислений;
- вычисления с пониженной точностью для успешной реализации алгоритмов ИИ при уменьшении требуемого количества транзисторов;
- ускоренный доступ к памяти, например, за счет хранения всего алгоритма ИИ в одном чипе;
- использование языков программирования, специально созданных для эффективного перевода кода ИИ для выполнения на соответствующем чипе.
Различные типы чипов ИИ применяются для разных задач. GPU чаще всего используют для начальной разработки и обучения алгоритмов, FPGA — для запуска обученных алгоритмов к реальным данным (вывода), а ASIC могут разрабатываться как для обучения, так и для вывода.
Обучение | Вывод | Общность | Точность вывода | |||
Эффективность | Скорость | Эффективность | Скорость | |||
CPU | 1 х базовый уровень | Очень высокая | ~98-99,7% | |||
GPU | ~10-100x | ~10-1000x | ~1-10x | ~1-100x | Высокая | ~98-99,7% |
FPGA | - | - | ~10-100x | ~10-100x | Средняя | ~95-99% |
ASIC | ~10-1000x | ~10-1000x | ~10-1000x | ~10-1000x | Низкая | ~90-98% |
Потенциал рынка
Генеральный директор AMD Лиза Су назвала целевой адресный рынок чипов искусственного интеллекта в $400 млрд. Чтобы понять смысл этой цифры, компания New Street Research проанализировала текущее состояние отрасли.
В настоящее время на рынке доминирует NVIDIA с объемом расходов в $38-39 млрд, за ней следует Broadcom, которая разрабатывает TPU для Google. Несмотря на значительный рост числа ускорителей ИИ, ожидается, что к 2027 году основную долю роста рынка займут графические процессоры.
По прогнозам New Street Research, в ближайшие годы индустрия чипов искусственного интеллекта будет существенно расти. К 2027 году рынок может достичь масштабов, при которых чипы искусственного интеллекта будут равны примерно 10 млн серверов, содержащих 100 млн чипов. Это соответствует примерно 10% пользователей интернета, использующих ИИ в различных целях.
Интеграция искусственного интеллекта в повседневные приложения и рабочие процессы будет стимулировать его использование и способствовать росту индустрии чипов ИИ.
Ключевые представители отрасли также осознают потенциал сектора. По данным СМИ, глава OpenAI Сэм Альтман возглавил инициативу по привлечению до $7 трлн на развитие полупроводниковой промышленности, чтобы в будущем обеспечить разработку искусственного интеллекта необходимыми вычислительными мощностями.
Не факт, что инициатива Альтмана обернется успехом. Однако этот шаг говорит о том, насколько серьезно технологические провидцы относятся к ИИ-гонке.
Влияние COVID-19 и генеративного ИИ
В начале пандемии COVID-19 полупроводниковая индустрия погрузилась в масштабный кризис из-за сбоев в цепочках поставок. Это негативно сказалось на всех отраслях, зависящих от поставок чипов — от автомобилестроения до сферы развлечений и потребительской электроники.
К 2022 году ситуация начала постепенно налаживаться. Ведущие производители адаптировались к новым реалиям, а связанные с пандемией ограничения были частично сняты. Однако выход чат-бота ChatGPT в конце ноября 2022 года усугубил нагрузку на только что оправившуюся отрасль.
Ошеломляющий успех этого сервиса от небольшого стартапа не остался незамеченным техногигантами. Microsoft, Google, Amazon, Meta и многие другие компании вступили в новую гонку разработок в сфере генеративного ИИ.
В результате полупроводниковая отрасль рискует вновь оказаться в ситуации жесткого дефицита. Спрос на ИИ-чипы становится просто невероятным, производители распродают будущие поставки на месяцы вперед, а на рынок выходит множество продуктов как от известных, так и от менее крупных компаний.
Главные игроки
На сегодняшний день лидером в производстве чипов для обучения ИИ является NVIDIA, занимающая 80% рынка. С начала 2023 года стремительный рост сектора генеративного ИИ взвинтил рыночную капитализацию компании с $364 млрд до $2,19 трлн.
Компании вроде Intel и AMD также активно инвестируют миллиарды долларов в разработку специализированных ИИ-чипов, стремясь занять свою нишу на этом перспективном рынке.
Поставщики облачных сервисов, включая Microsoft, Amazon и Google, тоже работают над созданием собственных ИИ-чипов. Хотя они остаются клиентами NVIDIA, техногиганты стремятся снизить зависимость от сторонних поставщиков и обеспечить себя необходимыми чипами в условиях надвигающегося дефицита.
На рынке представлены и другие игроки. В основном они разрабатывают узкоспециализированные решения. Среди них можно отметить Kneron, Cerebras Systems и Lightmatter.
Важно подчеркнуть, что производителей чипов по современному техпроцессу очень мало. Все вышеуказанные компании, как правило, заказывают полупроводники у TSMC, Intel и Samsung.
Будущее отрасли
Индустрия специализированных чипов для ИИ ожидает стремительного развития в ближайшие годы. Ключевыми драйверами станут растущий спрос, внедрение передовых технологических процессов и масштабные инвестиции в полупроводниковую отрасль. Ведущие игроки сосредоточатся на инновациях.
В 2024-2025 годах TSMC начнет выпуск первых партий и мелкосерийное производство 2-нм чипов. Массовый выпуск ожидается во второй половине 2025 года.
Переход на 2-нм техпроцесс нацелен на повышение энергоэффективности. Ожидается, что скорость транзисторов вырастет на 10–15% при том же энергопотреблении или энергопотребление снизится на 20–30% без потери быстродействия.
В 2026 году TSMC перейдет на 2-нм техпроцесс N2P второго поколения с обратной подачей питания. Intel после освоения 3-нм и 1,4-нм норм планирует разработку 1-нм техпроцесса, где 1 нм соответствует всего 4 атомам кремния в поперечнике.
Кроме того, ожидается развитие ИИ-чипов в потребительской электронике. Производители вроде Intel, AMD, Apple и Qualcomm активно внедряют специализированные нейронные процессоры (NPU) в свою продукцию. Они позволят запускать и выполнять ИИ-задачи непосредственно на устройствах пользователя.
Например, актуальный чип Qualcomm Snapdragon 8 Gen 3 уже может разворачивать модели вроде Stable Diffusion и Meta Llama 2. По данным разработчиков, он способен генерировать изображение менее чем за одну секунду — предыдущая технология справлялась примерно за 15 секунд. Для сравнения, хорошо оснащенному ноутбуку может понадобиться до двух минут, чтобы создать картинку.
Таким образом, постоянное совершенствование технологий производства обеспечит создание все более миниатюрных, производительных и энергоэффективных ИИ-чипов. Крупные инвестиции в эту перспективную отрасль подстегнут появление множества инноваций.
Текст: Богдан Каминский