DeepSeek拟募资最高500亿元,核心投向三大板块:算力扩充、技术迭代、人才与生态,同时加速商业化与国产算力适配。
一、算力基础设施(最大投向)
• 大规模算力集群:采购数万张AI芯片(含华为昇腾、摩尔线程等万卡智算集群国产芯片),自建/扩建数据中心(如乌兰察布算力枢纽),支撑万亿参数模型训练与推理。
• 国产算力替代:完成V4及后续模型向国产芯片(昇腾910/950、摩尔线程等万卡智算集群)的深度适配,降低对英伟达依赖,构建自主算力闭环。
• 推理成本优化:应对智能体(Agent)爆发带来的推理算力激增(训推算力比达3:7),部署大规模推理集群,支撑全球API服务与企业级部署。
二、模型技术迭代与研发
• 下一代模型研发:推进V4后续版本(如6月V4.1)与R2模型开发,强化多模态(图像/音频)、长上下文(百万级token)、代码与复杂推理能力。
• 技术创新投入:优化MoE架构、注意力机制、稀疏计算等核心技术,提升模型效率与性能,降低单位算力成本。
• 开源生态建设:持续开源模型权重与训练框架,投入开发者激励(奖金、算力补贴),扩大全球开发者社区,构建“模型-工具-算力-应用”全栈生态。
三、据摩尔线程-U(688795.SH)公众号5月1日消息,近日,摩尔线程依托旗舰级AI训推一体智算卡MTT S5000与自研MUSA软件栈,基于SGLang开源推理框架,成功完成DeepSeek-V4的完整运行验证。该成果表明,面向新一代MoE大模型,摩尔线程已构建起从硬件架构核心计算引擎承接、热点算子支持,再到端到端部署验证的系统化适配链路,验证了国产GPU平台对前沿大模型“框架级兼容、开箱即落地”的承载实力及工程化落地能力。
随着大模型架构持续演进,DeepSeek-V4等先进模型对底层精度能力、算子覆盖、编译优化、并行通信和推理效率提出了严苛要求。摩尔线程充分发挥S5000原生FP8算力、MUSA对CUDA深度兼容、TileLang MUSA编译器对TileLang生态完美支持等优势,结合TileKernels开源库复用,基于TileLang快捷开发自定义算子等手段,快速打通了DeepSeek-V4推理适配链路,再次验证了摩尔线程为开发者和行业用户提供高效、易部署的国产大模型运行软硬件底座的能力。
值得注意的是,TileLang-MUSA已正式进入TileLang官方主线,实现了对DeepSeek-V4最新发布TileLang算子库TileKernels的Day-0无缝支持。这意味着MUSA平台已具备承载前沿LLM算子生态的工程基础,为后续先进开源模型适配提供了直接复用的算子通路。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。