BTC $67 359 -0.21%Золото $2 341 +0.55%USD/RUB 93.42 +0.43%EUR/RUB 101.77 +0.38%Brent $67.24 -0.81%МосБиржа 2 854 +1.02%BTC $67 359 -0.21%Золото $2 341 +0.55%USD/RUB 93.42 +0.43%EUR/RUB 101.77 +0.38%Brent $67.24 -0.81%МосБиржа 2 854 +1.02%BTC $67 359 -0.21%Золото $2 341 +0.55%USD/RUB 93.42 +0.43%EUR/RUB 101.77 +0.38%Brent $67.24 -0.81%МосБиржа 2 854 +1.02%
Технологии
Korp&Co visual
Cerebras запускает триллионную модель Kimi K2.6 на рекордной скорости
#39260 · 22.05.2026
Технологии

Cerebras запускает триллионную модель Kimi K2.6 на рекордной скорости

Скорость генерации нейросети Kimi K2.6 на оборудовании Cerebras достигла 981 токена в секунду, опередив стандартные GPU-решения в 23 раза. Запуск открытой модели от Moonshot AI знаменует переход калифорнийского производителя чипов к коммерческой эксплуатации систем, способных мгновенно обрабатывать сложнейшие корпоративные запросы на написание кода.

Скорость генерации нейросети Kimi K2.6 на оборудовании Cerebras достигла 981 токена в секунду, опередив стандартные GPU-решения в 23 раза. Запуск открытой модели от Moonshot AI знаменует переход калифорнийского производителя чипов к коммерческой эксплуатации систем, способных мгновенно обрабатывать сложнейшие корпоративные запросы на написание кода.

Технологический прорыв на пластинах Wafer-Scale

Результаты независимого аудита Artificial Analysis подтверждают: запрос объемом 10 000 входных токенов обрабатывается системой Cerebras за 5,6 секунды. Для сравнения, официальный облачный сервис Kimi тратит на аналогичную задачу более 160 секунд. Этот разрыв обусловлен архитектурой процессора Wafer-Scale Engine 3, который исключает сетевые задержки, характерные для кластеров из множества видеокарт. Поскольку все данные размещаются на едином кристалле с 44 гигабайтами сверхбыстрой памяти SRAM, маршрутизация экспертов в модели Kimi K2.6 происходит на аппаратной скорости.

Успех проекта доказывает состоятельность стратегии Cerebras, долгое время находившейся в тени рыночных стереотипов. Обладая капиталом в 95 миллиардов долларов после недавнего IPO, компания переходит от работы с небольшими нейросетями к поддержке полноценных триллионных моделей. Архитектура Mixture-of-Experts позволяет Kimi K2.6 демонстрировать показатели, сопоставимые с GPT-5.4, при этом предлагая бизнесу альтернативу дефицитным мощностям OpenAI и Anthropic.

Сейчас доступ к мощностям ограничен корпоративным сектором и компаниями из списка Fortune 500. В Cerebras не стремятся конкурировать с бюджетными провайдерами, позиционируя себя как высокопроизводительный инструмент для автономных цифровых агентов. С учетом сделки Nvidia по покупке Groq и многомиллиардного контракта с OpenAI, борьба за скорость инференса становится главным полем битвы в ИИ-индустрии, где время отклика напрямую определяет эффективность бизнеса.

Комментарии (0)

Оставить комментарий

Пока нет комментариев. Будьте первым!