Feynman(费曼)架构LPU芯片(全球首发)
Feynman 是英伟达下一代旗舰 AI/GPU 架构,核心目标是极致低延迟、超高能效、高并发推理。
技术背景:2025年12月,英伟达斥200亿美元获Groq非独家技术授权,吸纳其核心团队,双方高度互补。
Feynman架构核心技术突破:
1,制程:1.6nm全球首发;背面供电,性能 + 8%–10%、功耗 - 15%–20%。
2.,核心创新:X3D 堆叠 + Groq LPU,突破内存墙与延迟,混合键合垂直集成,延迟降40%–85%;
LPU 核心能力:片上 SRAM:230MB,带宽80TB/s(传统 GPU 的10 倍 +)。
推理性能:Llama 2 70B 达500 tokens / 秒(GPT-3.5 的10 倍 +)。
能效:同任务功耗仅为传统 GPU 的1/10。 响应:交互延迟从0.5s→0.1s。
3,定位和分工:LPU定位专为AI大模型推理、实时 AI、Agent 交互的全新芯片,补齐英伟达推理算力短板,对抗谷歌的TPU芯片。(GPU负责训练/Prefill,LPU专攻Decode(实时生成))
4,目标场景:实时 AI、自动驾驶、金融交易、AGI 等超低延迟场景。
多层PCB:胜宏科技、沪电股份、深南电路、生益电子、广合科技
材料:生益科技、东材科技、圣泉集团、菲利华、德福科技、隆扬电子
SRAM存储:北京君正、恒烁股份
新芯片的重磅推出,意味着未来两年,算力建设的重心将从“以训练为主”,逐步转向“训练 + 推理并重”,甚至是推理为王。
推理机的数量远多于训练机,而且在规模化落地后,差距往往是一个数量级(10倍)起步。对面向大量用户的产品型公司,差距可能更大。
错过了GPU的“易中天”,不要错过LPU。

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。