显然对于这种量级的模型,评测已经意义不大了。事实上,当我和团队第一次使用它时,只测了4-5个片段,我们就停止了。因为当一个模型能力具备某些降维能力的时候,不用测太多,几个案例就足够感受到,就像 MJ v7 和 Veo2 发布时一样。比如下面这段:


所以本文不是评测,而是聊聊:在体验几天之后,我们觉得
Seedance2.0的上限大概在什么位置,以及对 AIGC 行业的影响有哪些。
所以这篇文章没有教程,没有哭天喊地的炫酷案例。几乎是我一本道的想法和絮叨。
核心观点AI视频的工作流大概率会迈入新阶段。——注意,不是一刀切说以前的没用了,理性看待。
AI内容过载到达巅峰,注意力严重稀缺。——是不是创作者的狂欢?是,但我们生产更多内容,不等于有更多人来看我们的内容,甚至相反。
广义内容的工业水准差异化几乎消失,但专业内容仍存在工业水准的差异。——Seedance 2.0 目前的上限,已经可以满足绝大部分内容场景的需要。
“足够”的Seedance2.0
首先,我有必要解释一下在开头引用《娱乐至死》的用意。这并非带有个人道德立场的判断,只是想澄清一个我自己看到的事实:
从2000年左右网络视频的流行开始,大众媒体消费内容的粗颗粒化、娱乐化、碎片化趋势开始加速,在2010年左右开启的移动互联网时代达到前所未有的高峰。
这一路上,从Youtube的业余摄影,到B站的二创文化,到竖屏短视频信息流的发明,再到短剧,无一不在体现这种变化。

诚然,伟大的尼尔波兹曼在几十年前就已经预见了今天的一切,但其未必想到今天的技术会让这种趋势如此登峰造极。
如今,对于主流的大众注意力消费市场而言,情绪和娱乐性的重要程度是高于对工业性的要求的。之所以要提这点,是有很多朋友会好奇Seedance2.0目前的上限能否满足商业和大众市场消费级的需求。我个人的观点是:大部分情况下,已经足够用了。
别再纠结什么1080P了,大部分用户对内容的需求,并不在工业规格上。这种情况下,Seedance2.0不仅是够用,甚至某些时候“超出预期”。
当然,话不能说绝对。工业质量并非变得没有意义。以短剧市场为例,让进入到过饱和的竞争之后,还是会有很多制作精良的作品出来,但已经这是另一个话题。
相比Veo2、Sora之前的“还差一点”,Seedance2.0把AI原生视频直出的标准又往前迈了一步,捅破了这层窗户纸:
在Seedance2.0之后,进入大众媒体消费市场的门槛,几乎归零。
下面就详细聊聊。
我自己对视频模型的关注点,其实一直只有两个:精确性和审美。本文也会围绕它们展开。


三天前,我发了一个朋友圈:

很多朋友当时不知道我说的是 Seedance 2.0。
当然,几个小时后,整个AIGC圈都炸锅了。
我不知道有多少人拿到了内测,但我知道拿到的人,那晚没睡觉的人居多。
澄清一下:说“首尾帧”的时代要结束了,并不是指首尾帧这种技术以后就没用了(还会大量存在,但用法会完全不一样)。而是想表达:AI视频的工作流可能要告别上一个时代的范式了,而“首尾帧”正是其最典型的代表模式。因为它几乎是在过去几年解决“精确性”的唯一方法。
这里展开一下:所谓“精确性”其实包含很多我们常见的话题:一致性(人物、场景),泛化能力的补足(通过强控修正物理逻辑),影像序列的延伸(说人话就是把动画“接”下去)等等。

但其实这种方法是无奈之举。
因为图片是一个非常不稳定,缺乏连续性的资产。一锤子买卖,复用度很低。
什么是有连续性,高复用度的资产呢?一定是基于对象的,或者时髦点叫ID化,比如角色资产,再比如场景资产。
有研发经验的朋友应该不难理解这个逻辑。这也是为什么Lora这个技术一直有相当的用户量。
大家会发现:之前很多模型已经开始有了参考功能,这其实是角色资产的一个雏形。可这些功能在之前并没有大量普及到工业制作中。
原因我觉得挺简单:还不够好用。比如MJ早早就有了万物参考功能,但效果:祝你有个好心情。
而精确性,恰恰是
Seedance 2.0 这次出圈的核心。它叫做:全能参考。
Seedance 2.0 之前,一致性究竟有没有好的解决方法?
这个事看怎么聊,如果大家就是做点小作品发发,或者简单弄个评测视频,乍一看之下,好像这个碗一早就解决了。
但如果做商业角度的工业生产,我很负责任地说:没有。
包括Banana Pro,角色一致性都差的很远。AI.TALK过去3年大概做了500个以上的数字人,还是有点资格聊聊这个事儿的。
其实判断模型的一致性不难:角色扔进去,反复开,不同角度不同光线,每次的“长相”是不是一致,和原图是不是一致。
推荐一个特别简单的360度测试方法,连续开几次,放在一起:


这两天已经有无数朋友让自己过足瘾当演员了,我就不花时间证明这件事了。
但“像”只是最基础的一步,举例来说,我用PS也可以把任何人的头P到任何人身上,但没法用,因为光线、色调、景深、滤镜、白平衡这些画质参数都有可能不对。
所以 Seedance 2.0 最大亮点其实是泛化性的能力表现。
泛化能力:震撼
刚才我们测试的时候特意放在不同的光线下,就是要测试角色在跨环境的情况下和环境的融合程度。







我不知道大家有没有用过这几年很多AI打光的工具,从个人体感来讲:之前没有任何一个图像或视频模型达到如此完美的光线融合,包括Seedream之前的版本。
这个特点在常见的商业化场景里非常有用,比如我想让老人演出水墨风格的动画片。

效率逆天了。
传统流程:首先要想办法用图片模型得到一张水墨风格的老人设定,这一步可能就快吐血了,然后再处理首尾帧需要的各种图片。运气好的话花点时间,运气不好的话可能根本就无解。
Seedance 2.0 的流程是这样的:

爽翻。
更离谱的是,我们甚至不太用得到再去出关键帧。这里就涉及到首尾帧这种技术的一个需求:动作的精控。
为啥要就精控动作和分镜?因为两个原因:
1. AI生成的不合理
2. 不是你想要的内容
对于第一个理由,Seedance来之后就大可不必了。强到离谱的泛化能力,让影片的每一个动作都无比合理,比如大家喜闻乐见的武打戏,和体育动作:


质量不评价了,主要是它几乎不出错,抽卡成本很低。这得益于 Seedance 2.0
出色的时序泛化能力。
再看一个让我惊讶的细节表现:
下面这个轻功的镜头,对武侠动作的还原能力却对是前无来者。尤其一个细节是:脚踩在树枝上产生的微微晃动,细节拉满。
@图片1的主角在@图片2的树林搞出实战蜻蜓点水的轻功前进。

我在这里想说的是,除非是那种必须要手工处理PS的颗粒度要求,那么大部分指定场景 Seedance 2.0 完全可以代劳,因为它的提示词语义遵循甚至比控制图片还方便。
比如我们在武术场景里指定:连续只用脚来击倒敌人。
主角 @图1 出现在古装电影中,用武功和反派蒙面黑衣人过招。然后用轻功旋转身体连续飞踢周围的几个人。

可以看到,视频中非常精确的还原了“旋转身体用脚攻击”的需求指令,并且占比很高。
实测下来我们是可以在 Seedance 2.0 极其精准的进行提示词指定动作的,比如我们更极限一点,精确到每一秒要出现的内容:
白衣主角出现在古装电影中,反派蒙面黑衣人。
00:01–00:02
主角腾空而起,鹞子翻身接“青龙探爪”,剑锋直取反派喉间,姿态优雅凌厉。
00:02–00:03
反派袖袍一震,暗器如雨散开,主角旋身“白鹤亮翅”尽数拨落。
00:03–00:04
主角落地滑步,“游龙步”贴地疾行,剑光贴着石板划出火星。
00:04–00:05
反派侧身闪避,反手一掌拍地,地砖震裂,尘土腾起遮蔽视线。
00:05–00:06
尘雾中主角闭目凝神,听风辨位,忽然反手刺出。
00:06–00:07
剑锋刺空——反派已跃上屋檐,衣袂翻飞俯视。
00:07–00:08
主角脚尖点柱,凌空三踏借力而上,剑身映出月光。
00:08–00:09
空中交锋,兵刃连击三下,火花四溅,镜头快速切换特写。
00:09–00:10
反派借力翻身落地,抽出腰间软剑,剑势如蛇。
00:10–00:11
主角退半步,改单手持剑为双手反握,气息骤沉。
00:11–00:12
二人同时前冲,地面碎石被气劲掀起悬空。
00:12–00:13
慢镜头——剑刃交错擦肩而过,发丝被削落一缕。
00:13–00:14
主角忽然弃剑,以掌为刃,“寸劲”击中反派胸口。
00:14–00:15
反派踉跄后退却冷笑,掌心暗光浮现——真正的杀招才刚刚开始。

我只开了一次卡,然后仔细对了一下,不能说是完美响应,但大部分的要求都满足到位了,并且实现了非常合理的动作连接。
因此,除了极个别场景依然需要手工定制图片,大部分的需求 Seedance
2.0 完全可以直出搞定。
这也是为什么我认为首尾帧为主要的工作流时代可能要“过去了”,因为在实战场景里目前 Seedance 2.0 表现的已经足够超出预期。
这是Seedance 2.0第一个意义:你只需要文字和核心图像资产,就可以迅速进入消费级内容市场。
审美:一切都回到选择
审美的部分,我想放在一起说了。
首先,对于画质的担心大可不必,虽然目前仅开放720P的解析度,但是完全够用。道理很简单:审美从来都不是规格的问题。
我甚至觉得720P是一个在性能和速度间很好的平衡。
由于万能参考的存在,任何你想参考的风格都可以有很好的延续,所以我们理论上是可以将审美“外包”的,一切都源于你找到的参考。
所以和以往的测试不同,去单独测试这个模型的视觉审美几乎没什么意义。因为它的审美几乎就是“万物”,你的选择是唯一标准。
比如我找来一张北欧风格的分镜,具备典型的冷峻、浅景深、画面颗粒感等特征,让 Seedance 2.0 续写:
把图1衍生为一部北欧电影的故事情节。


这是 Seedance 2.0 最出色的特点之一,完美还原参照物本身的特质。
放大细节,看一下 Seedance 2.0 表现出来的电影柔化和颗粒感令人惊叹。
真实和质感的关键点从来都不是“最清楚”,这是为什么有时候视频越清楚你会觉得越假。
影像和图像是不一样的,处在影像中的图像因为有连续性,大部分情况下其实是“不清楚的”,有兴趣的朋友可以找一些电影的截图自己观察一下。

除了视觉上的审美,Seedance 2.0 甚至可以“外包”剪辑和叙事的审美。
关于剪辑,这两天网上已经有很多朋友发过无数测试了。一句话总结就是:大部分情况下它完成的剪辑要比一般人出色的多。尤其是在快剪的领域。看一下下面这段打斗镜头:
在叙事上,它对提示词的理解让我觉得很夸张,可以根据不同提示词的要求,衍生完全不同氛围的风格呈现。
把图1分别衍生为悲剧和喜剧故事情节。

注意,它完成的不仅仅是情节,更是整体承包了分镜设计和剪辑方式。
悲剧案例中充满压迫感的高角度近距离特写,还有情绪表演都让人印象深刻。
席卷里中,使用了明显更快节奏的剪辑,配合的人物表情也是典型的喜剧中略显夸张的对话氛围。
综上,Seedance 2.0 在审美方面的表现有两个特点:
1. 由于万能参考的存在,他的审美是一个整体解决方案,包含了构图、画质、剪辑、表演。
2. 由于第1点的存在,它把审美问题拉回了原点:你的选择。
再说得直白一点:你可以把任何一部电影或者广义的作品看成一组“内容模板”,直接套用它的审美。
只有“选择”,是目前无法外包的。
行业影响:在爆炸中回到原点目前为止,我们已经大致梳理了 Seedance 2.0 在技术角度带来的变化,如果简单点概括:
1. 史无前例高效的生成精确、符合创作需求的影像
2. 审美完全取决于创作者的选择
基于此,这个模型对产业的影响可能有几点:
首先,所有使用 Seedance 2.0 进行创作的个人和团队,效率将大幅提升。而且这个提升速度不是简单的提升百分之多少,很可能是一种转移。因此,和旧的工作流做对比有可能是毫无意义的。
我们以一个15秒的镜头为例,如果正常剪辑按3-5个镜头。
原来的流程:生成3-5张分镜,包含设计、修图、开卡,然后生成3-5短视频,再剪辑。
现在的流程:一段提示词,反复开几次就可以了,而且 Seedance 2.0 的开卡率极高。

这会导致创作效率指数级上升,具体快到什么程度,只能看行业的实践了。
可以预见新的行业内卷一定会出现:价格、成本都会迎来新的挑战,对从业者来说是机会,也是问题。这里涉及到的方面太多,包括流量的分配机制,渠道的重新定义问题,先不展开。
这种效率的提升会导致AI内容史无前例的拥挤。类似的论调在 Veo2、Sora 出现时都有过预测和讨论。
但我认为这次不一样。
因为 Seedance 2.0 是可以满足大部分商用和工业场景应用的。这次被提效的不仅仅是普通爱好者,而是整个行业,这就很恐怖了。
AI内容的大量爆发在2026年几乎是注定的,其实圈子里大家心里都有准备这一天一定会到,只不过这次 Seedance 2.0 点燃了这个节点。
那么就必须回到另一个问题,这么多的内容,如何争夺注意力?你能生产更多,不等于就有更多的人来看。
所以它延伸到了我们在审美方面的讨论。Seedance 2.0 用“万能参考”这个方法,让创作回到了最初最初的原点:你的想法。
作为普通爱好者,如果只是为了“图个乐”,你可以放开脑洞随便玩耍。
但如果作为希望有伸进内容产业的专业团体和个体创作者,我的观点一直没变:低成本的Meme格式视频,无论多么火爆,都没有价值去跟随和模仿。
因为它不构成稀缺。
这里要补充一个观点,这个模型这么强,是不是说所谓专业能力已经完全失去意义了?
X上面有以为朋友发了一个动态,里面是一个 Seedance 2.0 生成的动画视频,然后问:现在坚持传统动画制作是不是已经没有意义?
我的看法没这么极端,在严格的商业场景下,专业人才和技术依然有很大的价值,不是说现在有了AI,专业团队的能力就完全被抹平了,至少现在不是。因为在画面规格,极高精确度的要求下,目前的AI依然无法满足要求。
但实话实说,对于大部分广义内容的市场要求,Seedance 2.0 的完成度已经足够,毕竟像短视频、短剧、网络广告等内容,对于精确性的要求本来就不高,主流内容的娱乐化带来的“相对粗糙”从2000年的网络视频开始就已经决定了趋势,而且几乎不可逆。
大部分情况下用户对于情绪的诉求远远大于工业精度,所以一切的一切就会到了那个最开始的问题:
我们到底要拍点什么给别人看。
最简单的就是最难的
陈丹青老师在一段采访中说过:当他到了纽约,没有任何创作限制后,反而陷入焦虑:他不知道该画什么了。
这让我想起《肖申克的救赎里》那段经典的关于“限制”的台词。
有的时候,“无限”反而是最难掌控的。
Seedance 2.0 的出现似乎在把问题简单化:你只要有选择能力,有想法,就能拍片。
但我不确定这是不是一个真的简单的处境,因为在我看来,“选择拍什么,选择审美”可能才是最难的。
工业水准从来都不是创作最关键的核心。
想法才是。
所以我总觉得 Seedance 2.0 的出现带有某种很“本质”的意味。它把这个市场的供给量拉到了史无前例的高度,然后在需求侧把最核心的拷问呈现了出来:
我们正在一起迈过一个临界点。随着节后火山引擎开放Seedance 2.0的API,我们将一起迎接这个AI内容彻底爆发的时代。
而现在的问题是:当什么都能拍的时候,我们拍什么?

S荣信文化(sz301231)S
、S中文在线(sz300364)S
、
S欢瑞世纪(sz000892)S
继续观看
Seedance2.0,产业狂欢与娱乐至死。
观看更多转载,Seedance2.0,产业狂欢与娱乐至死。汗青 AITalk已关注分享点赞在看已同步到看一看写下你的评论 视频详情作者声明: 本文转载自第三方,旨在提供资讯参考,并非证券推荐或投资建议。作者对内容的真实性、准确性不承担保证责任。本文不构成任何投资建议或证券推荐。截至发文日,作者与文中提及的标的不存在持仓关系。