觅睿科技920036——北交所次新股+最小ai智能体+物理AI+视觉理解

2026-06-03 11:59:484℃

英伟达全模态Cosmos 3：一个模型搞定物理智能看、想、做、演

物理世界需要一种新的智能，能同时看懂画面、听出声音、理解语言、预测运动、生成动作，还能把这一切串起来。

英伟达的 Cosmos 3 做到了，一个模型，五种模态，理解和生成一把抓，在多个主流榜单上拿下开源第一。

Cosmos 3 是英伟达最新发布的全模态（Omnimodal）世界模型，面向 Physical AI（物理智能），用一套统一的 Mixture-of-Transformers（MoT，混合Transformer）架构，同时处理和生成语言、图像、视频、音频与动作序列。它把视觉语言模型、视频生成器、世界模拟器、世界-动作模型四种角色合并成一个框架

前向动力学是 Cosmos 3 另一个核心能力。给它当前的观测和动作控制信号，它就能"演算"未来的视频帧。给自动驾驶系统当前的传感器数据和方向盘转角，它能预测车辆未来的行驶轨迹和周围环境变化。这相当于给智能体装了一个世界模拟器，先在脑中预演一遍，看看结果，再决定怎么行动。对机器人规划、自动驾驶仿真、合成数据生成来说，这是刚需。逆动力学则反过来。给它一段观测视频，它恢复出导致场景变化的轨迹或控制信号，把视频证据转化为可执行动作。

适合部署端侧推理和实时交互场景，比如工厂里的分拣机器人需要实时感知和决策，Nano 的推理速度能跟上产线节拍。

$觅睿科技(BJ920036)$
觅睿科技已研发十多种场景化 AI 算法，支持云端、边缘端、设备端灵活部署，满足低功耗与实时性需求，新增手势识别、行为分析、人数统计等功能。

觅睿AI灵瞳视频大模型（灵瞳AI Agent）

• 四大核心能力：

◦ 智搜：自然语言理解，秒级定位“红衣男子携黑背包”等复杂目标

◦ 智检：自定义检测规则，自动识别可疑行为

◦ 智析：行为分析+语义理解，输出事件摘要

◦ 智联：多设备协同，形成安全防护网络

• 技术特点：端云协同+轻量化部署，低功耗高准确率，适配民用全场景

• 音频AI技术解决了婴儿哭声检测的误报问题，广泛应用于看护类产品

AI算法覆盖全系列产品，构建异构计算与多摄Re-ID专利体系，形成技术代差

• 从“通用消费级”向“智能感知+行为理解”升级，提升产品溢价能力

灵瞳AI Agent视频大模型是差异化竞争关键，实现从“被动监控”到“主动智能体”跨越

• AI增值服务（如自定义检测、视频分析）成为新增长点

作者声明：本文转载自第三方，旨在提供资讯参考，并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日，作者与文中提及的标的不存在持仓关系。

标签: 传感器机器人英伟达

合规声明：本站发布的所有文章及观点均系个人研究共享，投资心得交流，不代表本站立场，且不构成任何形式的投资建议。投资者据此操作，风险自担，请务必保持独立审慎的决策态度。

本文链接：https://www.sanhuba.cn/post/af-fb-23469.html

上一篇泓淋电力绑定迈威尔科技Marvell，高速铜缆切入AI互联黄金赛道

下一篇中国三轮，全球爆单，哪些A股公司涉足？

觅睿科技920036——北交所次新股+最小ai智能体+物理AI+视觉理解

传感器相关

栏目分类

机器人相关

英伟达相关

用户须知

觅睿科技920036——北交所次新股+最小ai智能体+物理AI+视觉理解

 传感器相关

 栏目分类

 机器人相关

 英伟达相关

用户须知

传感器相关

栏目分类

机器人相关

英伟达相关

用户须知