英伟达与亚马逊巨头联手推进GPU直存发展

2026-05-21 12:57:143
国联民生计算机】❗英伟达Vera Rubin或与AWS联手推进GPU直存(GIDS),持续推荐国内GPU直存唯一标的信测标准
巨头联手,加速推进GPU直存(GIDS)发展
据techtimes报道,英伟达和亚马逊正在推进存储架构的研发,该架构允许GPU直接控制SSD等存储设备,有望扩大数十倍“显存”空间;微软与AMD也在同步推进类似方案。
信测标准参股的锋行致远是国内GPU直存龙头
锋行致远自研的存算一体加速模组,容量为1.6TB或3.2TB,该模组将计算能力直接集成于存储设备内部,可在数据存放位置直接执行向量检索、KV缓存、数据过滤等任务,显著减少数据搬运,最高可降低访存成本98%以上。

【国盛计算机】星环科技:GPU-Native数据库平台


与NV合作,向量/图/认知数据库均在完成双向适配,得到认可、卡位优秀;#下一步或可共同探讨GPU直连方案,公司本身的ArgoDB就是分布式闪存数据库,技术前瞻性和市场空间有目共睹。
1、大模型推理潮起、计算架构亟需转向“以GPU为核心”。
1)控制vs计算:传统计算架构以CPU为核心,本身是为了运行操作系统、Web服务器这种逻辑复杂的程序设计的,并行计算能力弱,内存带宽低。对于AI这种“傻大黑粗”的暴力计算,CPU大部分晶体管(用于控制逻辑的)都在“摸鱼”。而GPU强项即在于SIMT单指令多线程,AI推理(如Transformer模型)就是一层层的矩阵运算,数据之间没有太多的逻辑依赖,天然适合GPU并行吞吐。2)内存墙:AI大模型推理最大的瓶颈往往不是算得不够快,而是数据供不上来。CPU使用DDR内存,带宽通常在50-200GB/s;而GPU使用HBM,带宽可达到2-5TB/s。
2、#GPU直连是目标、NV&存储厂已开始探索。
1)打破PCIe瓶颈:传统架构中,GPU是插在PCIe插槽上的“外设”,数据必须先经过CPU,再通过PCIe总线(速度较慢)传给GPU。改变后,NVLink/NVSwitch让GPU之间直接互联,不走CPU,构建巨型显存池;#CXL允许GPU直接访问系统内存,甚至让CPU和GPU共享同一块内存地址空间,消除搬运数据的开销;也可以像NVIDIA的Grace-Hopper超级芯片或苹果的M系列芯片,CPU和GPU封装在一起,物理上共享同一块高带宽内存。2)存储直连:现在的路径很长、CPU负担重,从硬盘读取数据 -> 进系统内存 -> CPU处理 -> 拷贝到GPU显存;通过存储直连GPU技术,让NVMe SSD直接把数据传输到GPU显存(DMA技术),完全绕过CPU。这意味着“硬盘”直接对接“主计算单元(GPU)”,CPU只负责发号施令,不碰数据。3)网络直连:在集群推理中,网卡(NIC)接收到的数据不再经过CPU处理,而是直接通过RDMA技术写入GPU显存。
3、数据库向GPU-Native变革、计算效率呈量级提升。
1)算子重构:传统DB的Join、Filter、Group By、Scan 等算子都是用C++/Java为CPU写的,后续须用CUDA或OpenCL重写这些算子。数据库查询引擎在生成执行计划时,直接调用GPU内核函数,在显存中完成数据的过滤、聚合和连接。2)内存管理:以后数据库需要直接管理GPU显存(VRAM),显存非常昂贵且有限,数据库需要智能的算法来决定哪些热数据常驻显存,哪些数据通过GDS快速换入换出。3)数据布局:从对CPU友好的行式存储到对GPU友好的列式存储,同时对齐磁盘上的数据格式、内存里的数据格式、传给GPU的格式。4)全面向量化:数据库查询引擎不能再一次处理一行数据,而必须是一次处理一个向量块;同时,AI推理通常伴随着RAG, 数据库内核需内置GPU加速的向量索引(如GPU-IVF-Flat)。
4、将数据库与GPU直接适配,是短期成熟、可行、有效益的方案。
核心逻辑是:硬件架构当前直接改造比较复杂,那就把应用层的计算重心下沉到离数据最近的地方。1)当前,向量数据库与GPU的适配已成熟,用户只需要配置带有CUDA驱动的服务器,安装对应版本的数据库软件即可。图数据库与GPU的适配正在启动,虽然比向量库稍微小众、但技术栈已经存在。另外,库内模型已验证可行,即不是把数据查出来发给Python服务去跑模型,而是把模型加载到数据库进程里(或者显存里),直接对查询结果做处理。2)如此一来,向量与图查询性能可得到数量级提升,应用界面“瞬时响应”,例如在CPU上做千万级的向量搜索可能需要几百毫秒,而在GPU上通常能压缩到毫秒级(<10ms)。同时,端到端的延迟会大幅降低,特别适合实时推荐及金融风控场景。
风险提示:AI推进不及预期、行业竞争加剧、宏观经济波动
联系人:陈芷婧/刘高畅

作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。