DeepSeek发布新视觉模型,同为股份AI视觉ISP技术迎来重大机遇

2026-01-27 13:00:505

DeepSeek发布新视觉模型,同为股份AI视觉ISP技术迎

DeepSeek-OCR2是DeepSeek-AI推出的一款先进视觉语言模型,核心创新在于采用DeepEncoder V2编码器,通过将CLIP组件替换为LLM风格架构、引入因果流查询与定制化注意力掩码,实现视觉令牌的语义驱动动态重排,突破传统栅格扫描顺序的局限;该模型维持256-1120视觉令牌压缩范围,在OmniDocBench v1.5基准测试中整体性能达91.09%,较基线模型提升3.73%,阅读顺序编辑距离降至0.057,同时降低线上与PDF处理场景的重复率,兼具研究创新性与实际应用价值,还为真正2D推理和原生多模态融合提供了新路径。



核心创新:

同为股份:公司关于AIISP技术的产品也已经有成熟产品线投放市场


星宸科技:公司核心研发团队具有丰富的SoC芯片设计经验,核心IP均为自研,已形成AI、ISP、音频、视频、显示、感知等核心IP


富满微:公司长期深耕视觉领域,是以视频为中心的芯片和完整解决方案提供商致力于为客户提供高性能视频编解码IPC以及NVR SoC芯片、图像信号处理器ISP芯片


作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。

标签: DeepSeek芯片

合规声明:本站发布的所有文章及观点均系个人研究共享,投资心得交流,不代表本站立场,且不构成任何形式的投资建议。投资者据此操作,风险自担,请务必保持独立审慎的决策态度。