海量数据 全栈国产化 深度绑定华为 AI 数据库 对标英伟达GPU直连新架构

2026-05-21 12:50:194
1、大模型推理潮起、计算架构亟需转向“以GPU为核心”。
1)控制vs计算:传统计算架构以CPU为核心,本身是为了运行操作系统、Web服务器这种逻辑复杂的程序设计的,并行计算能力弱,内存带宽低。对于AI这种“傻大黑粗”的暴力计算,CPU大部分晶体管(用于控制逻辑的)都在“摸鱼”。而GPU强项即在于SIMT单指令多线程,AI推理(如Transformer模型)就是一层层的矩阵运算,数据之间没有太多的逻辑依赖,天然适合GPU并行吞吐。2)内存墙:AI大模型推理最大的瓶颈往往不是算得不够快,而是数据供不上来。CPU使用DDR内存,带宽通常在50-200GB/s;而GPU使用HBM,带宽可达到2-5TB/s。
2、#GPU直连是目标、NV&存储厂已开始探索。
1)打破PCIe瓶颈:传统架构中,GPU是插在PCIe插槽上的“外设”,数据必须先经过CPU,再通过PCIe总线(速度较慢)传给GPU。改变后,NVLink/NVSwitch让GPU之间直接互联,不走CPU,构建巨型显存池;#CXL允许GPU直接访问系统内存,甚至让CPU和GPU共享同一块内存地址空间,消除搬运数据的开销;也可以像NVIDIA的Grace-Hopper超级芯片或苹果的M系列芯片,CPU和GPU封装在一起,物理上共享同一块高带宽内存。2)存储直连:现在的路径很长、CPU负担重,从硬盘读取数据 -> 进系统内存 -> CPU处理 -> 拷贝到GPU显存;通过存储直连GPU技术,让NVMe SSD直接把数据传输到GPU显存(DMA技术),完全绕过CPU。这意味着“硬盘”直接对接“主计算单元(GPU)”,CPU只负责发号施令,不碰数据。3)网络直连:在集群推理中,网卡(NIC)接收到的数据不再经过CPU处理,而是直接通过RDMA技术写入GPU显存。
3、数据库向GPU-Native变革、计算效率呈量级提升。
1)算子重构:传统DB的Join、Filter、Group By、Scan 等算子都是用C++/Java为CPU写的,后续须用CUDA或OpenCL重写这些算子。数据库查询引擎在生成执行计划时,直接调用GPU内核函数,在显存中完成数据的过滤、聚合和连接。2)内存管理:以后数据库需要直接管理GPU显存(VRAM),显存非常昂贵且有限,数据库需要智能的算法来决定哪些热数据常驻显存,哪些数据通过GDS快速换入换出。3)数据布局:从对CPU友好的行式存储到对GPU友好的列式存储,同时对齐磁盘上的数据格式、内存里的数据格式、传给GPU的格式。4)全面向量化:数据库查询引擎不能再一次处理一行数据,而必须是一次处理一个向量块;同时,AI推理通常伴随着RAG, 数据库内核需内置GPU加速的向量索引(如GPU-IVF-Flat)。

4、将数据库与GPU直接适配,是短期成熟、可行、有效益的方案。

核心逻辑是:硬件架构当前直接改造比较复杂,那就把应用层的计算重心下沉到离数据最近的地方。1)当前,向量数据库与GPU的适配已成熟,用户只需要配置带有CUDA驱动的服务器,安装对应版本的数据库软件即可。图数据库与GPU的适配正在启动,虽然比向量库稍微小众、但技术栈已经存在。另外,库内模型已验证可行,即不是把数据查出来发给Python服务去跑模型,而是把模型加载到数据库进程里(或者显存里),直接对查询结果做处理。2)如此一来,向量与图查询性能可得到数量级提升,应用界面“瞬时响应”,例如在CPU上做千万级的向量搜索可能需要几百毫秒,而在GPU上通常能压缩到毫秒级(<10ms)。同时,端到端的延迟会大幅降低,特别适合实时推荐及金融风控场景。



北京海量数据技术股份有限公司(股票代码:603138.SH)2007年成立,致力于开发提升硬件效率的纯国产数据库,推出了面向通用场景的关系型数据库Vastbase G100和面向AI场景的向量数据库Vastbase V100,产品全栈国产化、应用满足度高,已广泛应用于党政、央国企、制造、金融、通信、医疗、教育、交通、能源等3000+家客户,是国产企业级数据库的首选品牌之一

海量数据(603138):华为 AI 数据库唯一商业发行伙伴,openGauss 内核 + 向量 AI 双轮驱动,信创 + AI 弹性标的

在华为 GaussDB/openGauss 生态强势扩张、AI 向量数据库成为大模型刚需的背景下,海量数据作为华为 openGauss 社区副理事长单位、核心商业发行伙伴,深度绑定华为 AI 数据库战略,Vastbase 系列完成 “关系 + 向量 + AI” 全栈适配,是 A 股纯正华为 AI 数据库 + 信创双主线稀缺标的,小市值、高弹性、订单加速兑现!

一、核心绑定:华为 AI 数据库 “亲儿子”,openGauss 唯一深度商业化伙伴

1. 技术同源:内核 100% 华为 openGauss,AI 能力无缝打通

内核根基:Vastbase G100/V100基于华为 2020 年开源的 openGauss 内核,国内首批商业发行版;华为主导内核迭代、安全补丁,海量数据做行业化增强、交付与 AI 适配,“华为做底座、海量做场景” 深度分工。

AI 原生兼容:华为 GaussDB 为国内首个 AI-Native 数据库,内置 AI 优化引擎与向量能力;海量数据 Vastbase完全兼容华为 GaussDB AI 语法与向量接口,可直接调用华为盘古大模型能力,实现 “数据库 + 大模型” 一体化部署华为云。


作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。