觅睿科技920036——北交所次新股+最小ai智能体+物理AI+视觉理解

2026-06-03 11:59:481
英伟达全模态Cosmos 3:一个模型搞定物理智能看、想、做、演

物理世界需要一种新的智能,能同时看懂画面、听出声音、理解语言、预测运动、生成动作,还能把这一切串起来。

英伟达的 Cosmos 3 做到了,一个模型,五种模态,理解和生成一把抓,在多个主流榜单上拿下开源第一。

Cosmos 3 是英伟达最新发布的全模态(Omnimodal)世界模型,面向 Physical AI(物理智能),用一套统一的 Mixture-of-Transformers(MoT,混合Transformer)架构,同时处理和生成语言、图像、视频、音频与动作序列。 它把视觉语言模型、视频生成器、世界模拟器、世界-动作模型四种角色合并成一个框架


前向动力学是 Cosmos 3 另一个核心能力。给它当前的观测和动作控制信号,它就能"演算"未来的视频帧。 给自动驾驶系统当前的传感器数据和方向盘转角,它能预测车辆未来的行驶轨迹和周围环境变化。 这相当于给智能体装了一个世界模拟器,先在脑中预演一遍,看看结果,再决定怎么行动。对机器人规划、自动驾驶仿真、合成数据生成来说,这是刚需。 逆动力学则反过来。给它一段观测视频,它恢复出导致场景变化的轨迹或控制信号,把视频证据转化为可执行动作。

适合部署端侧推理和实时交互场景,比如工厂里的分拣机器人需要实时感知和决策,Nano 的推理速度能跟上产线节拍。


$觅睿科技(BJ920036)$
觅睿科技已研发十多种场景化 AI 算法,支持云端、边缘端、设备端灵活部署,满足低功耗与实时性需求,新增手势识别、行为分析、人数统计等功能。

觅睿AI灵瞳视频大模型(灵瞳AI Agent)

• 四大核心能力:

◦ 智搜:自然语言理解,秒级定位“红衣男子携黑背包”等复杂目标

◦ 智检:自定义检测规则,自动识别可疑行为

◦ 智析:行为分析+语义理解,输出事件摘要

◦ 智联:多设备协同,形成安全防护网络

• 技术特点:端云协同+轻量化部署,低功耗高准确率,适配民用全场景

• 音频AI技术解决了婴儿哭声检测的误报问题,广泛应用于看护类产品

AI算法覆盖全系列产品,构建异构计算与多摄Re-ID专利体系,形成技术代差

• 从“通用消费级”向“智能感知+行为理解”升级,提升产品溢价能力


灵瞳AI Agent视频大模型是差异化竞争关键,实现从“被动监控”到“主动智能体”跨越

• AI增值服务(如自定义检测、视频分析)成为新增长点


作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。