Разработчики DeepSeek V4 Pro успешно завершили постобучение нейросети, отказавшись от вычислительных мощностей Nvidia или AMD. Исследователи задействовали кластер из тысячи чипов Huawei Ascend 910C, что стало значимым шагом к технологической независимости китайской индустрии ИИ в условиях ограниченного доступа к западным комплектующим.
Процесс постобучения, или доводки модели под конкретные инструкции и правила безопасности, традиционно считался «узким местом» для китайских разработчиков. В отличие от простого запуска готовых алгоритмов, этот этап требует колоссальных вычислительных затрат. Ранее DeepSeek V3 обучался на массиве из 2048 чипов Nvidia H800, однако ужесточение экспортного контроля вынудило компанию искать альтернативы внутри страны.В реализации проекта участвовали специалисты Huawei совместно с Шэньчжэньским институтом больших данных и Харбинским технологическим институтом. Использование 1000 процессоров Ascend 910C позволило провести полное обновление параметров модели V4 Pro без изменения ее архитектуры. Этот успех подчеркивает способность китайских чипов справляться с задачами, которые ранее были монополией западных компаний. Сейчас DeepSeek готовится к привлечению инвестиций в размере 50 млрд юаней, планируя укрепить позиции своего семейства моделей как конкурента западным разработкам вроде ChatGPT.
Комментарии (0)
Пока нет комментариев. Будьте первым!