Новый виток в AI: Cerebras открывает шесть дата-центров для масштабирования мощностей

Cerebras Systems намерена расширить свои возможности в сфере искусственного интеллекта, открыв новые центры обработки данных по всей Северной Америке и Европе.

Компания планирует сосредоточить 85% своих ресурсов в США, где уже работают три объекта в Санта-Кларе, Стоктоне и Далласе. В ближайшие годы будет запущено несколько новых центров: в Миннеаполисе (второй квартал 2025 года), Оклахома-Сити и Монреале (третий квартал), а также в Атланте и во Франции (четвертый квартал).

В этих центрах будут использоваться мощности Cerebras wafer-scale, инновационной архитектуры чипов, созданной специально для AI-приложений. По утверждению компании, ее системы CS-3 смогут обрабатывать 40 миллионов токенов Llama-70B в секунду при выполнении задач вывода.

В Оклахома-Сити запланировано размещение более 300 систем CS-3. Центр, построенный в соответствии с требованиями уровня 3+, будет оснащен защитой от торнадо и землетрясений, а также тройной системой резервирования электроснабжения. Его запуск намечен на июнь 2025 года.

Несколько известных компаний в области искусственного интеллекта уже подтвердили свои намерения использовать инфраструктуру Cerebras. Среди них французский стартап Mistral с его помощником Le Chat и системой ответов Perplexity. Кроме того, HuggingFace и AlphaSense также зарегистрировались для работы на платформе.

Технология особенно актуальна для моделей рассуждения, таких как Deepseek-R1 и OpenAI o3, которые обычно требуют значительного времени для вычислений и генерируют множество токенов в процессе обработки информации.

Это расширение является частью более широкой стратегии роста Cerebras до 2025 года, часть объектов будет работать в сотрудничестве с эмиратской компанией G42. В Монреале дочерняя компания Bit Digital Enovum возглавит работу центра, который, по прогнозам, обеспечит скорость вывода, в десять раз превышающую производительность современных графических процессоров, при запуске в июле 2025 года.

Cerebras Systems специализируется на создании чипов для AI, применяя уникальный метод — использование целых пластин в качестве отдельных чипов, известных как «Wafer Scale Engines». WSE-3, являющийся третьим поколением этой технологии, представляет собой свежий шаг в данной области.

На текущий момент система используется в таких учреждениях, как Аргоннская национальная лаборатория, Питтсбургский суперкомпьютерный центр и GlaxoSmithKline. Однако существуют определенные ограничения: она не поддерживает нативную CUDA (стандарт Nvidia) и обладает меньшей совместимостью с серверами по сравнению с решениями Nvidia.

Источник.