北电数智助推国产算力与国产大模型融合 迸发信创之光

近日,北京电子数智科技有限责任公司(以下简称“北电数智”)基于其“宝塔·模型适配平台”成功完成了DeepSeek-V3/R1全尺寸模型与海光DCU、华为、壁仞科技、沐曦等国产芯片的混元算力适配,这将为开发者在使用DeepSeek模型过程中带来更多算力选择,且用户在使用国产算力时可忽略底层硬件差异,实现快速开发部署和模型调用。

DeepSeek-V3/R1是深度求索公司(DeepSeek)开发的一款先进的人工智能模型,拥有强大的数据处理和分析能力,可广泛应用于自然语言处理、图像识别、语音识别等领域。DeepSeek采用创新的混合专家系统(DeepSeekMoE)、多头潜在注意力机制(MLA)、自研训练框架等多项工程化创新,基于较少GPU训练资源和时间消耗实现R1与OpenAI o1‌相当、V3与OpenAI 4o相当的模型性能,模型具有高推理效率和低训练成本的优势。

北电数智“宝塔·模型适配平台”与各大主流开发框架保持高度兼容性,当前已完成24款基座大模型适配,可进一步帮助降低企业和开发者的使用门槛。其能够抹平芯片架构层的差异,快速实现对模型的优化支持和硬件适配。比如在处理推理任务时,北电数智的混元推理技术路线与DeepSeek技术路线高度匹配,可进一步优化推理效果、加速推理速度、降低推理成本,解决算力不够用等问题。在北电数智“宝塔·模型适配平台”的加持下,DeepSeek-V3/R1可在混元芯片上高效、稳定运行支撑各类应用场景。此外,为全面挖掘国产芯片性能潜力与模型适配能力,北电数智还推出“星火·国产算力AI原生适配认证”,加强国产模型与国产算力间适配协同能力,推动国产芯片更好支撑AI原生应用场景。

国产芯片和如DeepSeek等优秀的国产大模型产生的紧密联动与化学反应中,我们已经看到了全栈AI国产化路上的光芒…

关注“北电数智AI江湖”小程序,查看更多资讯。