LPU芯片首发,AI进入推理大时代。

2026-03-18 07:34:104

Fe­y­n­m­an(费曼)架构LPU芯片(全球首发)
Fe­y­n­m­an 是英伟达下一代旗舰 AI/GPU 架构,核心目标是极致低延迟、超高能效、高并发推理。
技术背景:2025年12月,英伟达斥200亿美元获Gr­oq非独家技术授权,吸纳其核心团队,双方高度互补。
Fe­y­n­m­an架构核心技术突破:
1,制程:1.6nm全球首发;背面供电,性能 + 8%–10%、功耗 - 15%–20%。
2.,核心创新:X3D 堆叠 + Gr­oq LPU,突破内存墙与延迟,混合键合垂直集成,延迟降40%–85%;
LPU 核心能力:片上 SR­AM:230MB,带宽80TB/s(传统 GPU 的10 倍 +)。
推理性能:Ll­a­ma 2 70B 达500 to­k­e­ns / 秒(GPT-3.5 的10 倍 +)。
能效:同任务功耗仅为传统 GPU 的1/10。 响应:交互延迟从0.5s→0.1s。
3,定位和分工:LPU定位专为AI大模型推理、实时 AI、Ag­e­nt 交互的全新芯片,补齐英伟达推理算力短板,对抗谷歌的TPU芯片。(GPU负责训练/Pr­e­f­i­ll,LPU专攻De­c­o­de(实时生成))
4,目标场景:实时 AI、自动驾驶、金融交易、AGI 等超低延迟场景。
多层PCB:胜宏科技沪电股份深南电路、生益电子广合科技
材料:生益科技东材科技圣泉集团菲利华德福科技隆扬电子
SR­AM存储:北京君正恒烁股份
新芯片的重磅推出,意味着未来两年,算力建设的重心将从“以训练为主”,逐步转向“训练 + 推理并重”,甚至是推理为王。
推理机的数量远多于训练机,而且在规模化落地后,差距往往是一个数量级(10倍)起步。对面向大量用户的产品型公司,差距可能更大。
错过了GPU的“易中天”,不要错过LPU。

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。