Технический прорыв Meituan заключается в использовании 50 тысяч специализированных чипов, вероятно, связанных с экосистемой Huawei. Архитектура модели опирается на механизм разреженного внимания LSA, который переводит обработку длинных данных из квадратичной сложности в почти линейную. Эффективность системы достигается за счет динамической активации параметров: модель задействует от 33 до 56 млрд весов на токен в зависимости от сложности задачи, что оптимизирует затраты на вычисления.
Разработчики применили метод дистилляции MOPD, объединив знания трех типов экспертных подмоделей: агентных, логических и интерактивных. В тестах SWE-bench Pro новинка набрала 59,5 балла, приблизившись к показателям флагманов вроде Claude Opus и GPT-5.5. Практические возможности уже включают автоматическое создание веб-приложений, рефакторинг крупных кодовых баз и генерацию 3D-сцен, что подтверждает готовность китайской инфраструктуры к созданию систем триллионного масштаба без использования западного оборудования.
Комментарии (0)
Пока нет комментариев. Будьте первым!