DeepSeekV4更多细节曝光,最快下周友布"APPSP"微信公众号消息,DeepSeekV4的细节,正在陆续浮出水面。科技账号Legit率先披露,V4的轻量版本代号为「sealion-lite(海狮轻量版)」,目前已在至少一家推理服务商处展开内测,相关方均签署了严格的保密协议。据悉,该版本支持100万token上下文窗口,原生具备多模态能力,性能明显优于现有网页及应用端模型。另有用户同期展示了V4生成的SVG样本,直言效果相当亮眼。在参数疑似泄露的同期,今天凌晨,路透社援引知情人士消息称,DeepSeek计划最快于下周发布DeepSeekV4。结合此前南华早报透露的消息,DeepSeek下一代旗舰模型预计将是一款万亿参数级别的基础模型。且正是由于模型规模大幅增长,训练速度明显放缓,导致发布时间被推迟。但路透社报道中还提到,在发布V4之前,DeepSeek并未按行业惯例向英伟达、AMD等美国芯片厂商提供模型预览,转而提前数周向包括华为在内的中国芯片供应商开放访问权限,以便完成适配和优化工作。截至发稿前,英伟达与AMD均拒绝置评,DeepSeek和华为亦未作出回应。
作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。