前天,微软Bing宣布在其应用程序中推出 Bing 视频创作器(Bing Video Creator),该功能基于OpenAI的Sora模型,允许用户通过文本提示词生成视频。这也是
就在昨天,Manus推出原生文生视频,嵌入进了自家Agent的工作流中。
一个是默默关注Sora、OpenAI背后的“大东家”,另一个则是AI Agent里的“新秀”,两方在自家产品生态中上马文生视频的时间点几乎是一样的。可见,微软这一步棋到底慢了多久。
从Sora代号第一次问世到现在,整体局面的发展路径很像:“微软想要,OpenAI不给,但最后微软如愿以偿得到了Sora的副产品”。
为什么说它是Sora的副产品?因为微软上线的Bing 视频创作器从产品力和宣传上来讲,很难说得上是个完整的产品。
当微软终于宣布将它免费向用户开放时,这个消息并未掀起预期中的热潮,反而透着一股尴尬的迟到感。网友对这款产品的“自来水”评价很差,甚至直言:我们已经有了可灵和Veo,为何还用Sora?
Sora,这个曾被OpenAI寄予厚望、甚至被誉为“AI视频领域的牛顿时刻”的模型,自诞生之日起便充满了戏剧性:不断延期、高昂的定价、复杂的安全风险,让市场对它的期待逐渐消退。如今微软通过Bing上线了免费的“Bing 视频创作器”,但它却显得有些“食之无味,弃之可惜”,从产品力到用户反馈,都难以令人满意。
下面让我们来看看,在微软与OpenAI的复杂博弈中上线的Bing 视频创作器,到底体验如何?
当OpenAI首次官宣Sora时,“Sora的诞生是牛顿时刻”的说法迅速刷屏网络,甚至激发了诸多科技大厂的产品灵感与探索方向。当时的OpenAI用实际宣发告诉所有人:AI得这么玩。
尽管如今文本生成视频已经成了“烂大街”的常规功能,但在当时几乎只有Sora成功出圈了。
虽然经历了一次次延期,但OpenAI的深厚技术底蕴依然稳固,Sora的视觉表现虽不能称得上顶尖,仍旧处于业界第一梯队。如今,这个备受关注的明星产品也终于免费上线微软的Bing视频生成器,用户可以直接体验。
不过,免费归免费,微软的Bing视频生成器目前仍存在明显局限:视频长度仅限5秒,画面比例只有9:16可选,且同时最多只能排队生成三个视频。更尴尬的是,其生成速度也颇为感人,Fast模式尚需几分钟,Standard模式甚至要耗费数小时,难免让人怀疑微软究竟获得了OpenAI多少的资源支持。
我们实际测试了两个案例,来看一看Bing视频生成器和现在的SOTA模型相比,效果如何:
一只羊驼穿着蓝色的西装,像人一样双腿直立,在中央公园的冰面上跳着动感舞曲
画面主体羊驼辨识度低,背景AI感强烈,动作虽流畅,但整体质感回到了一年前。如果我不提谁能看得出来这是只羊驼?
紧接着,我同样用OpenAI的Sora试了下九游娱乐文化 九游app官方入口一模一样的提示词。画面的视觉效果明显上了一个层次,无论是颜色的层次感、画面主体的动作流畅度,甚至是冰面的阴影的显示都很线大师版了。虽然用最新出的模型去对比Sora有点欺负人,但是2.1的普通模式无法文生图,也就只能出出血,拿大师版试一下了。
相比之下,即梦的效果就比较抽象了。风格略显割裂,背景像是绿幕效果,动作重复且表情僵硬,整体表现不佳。我很怀疑是否是我的提示词给错了。
谷歌的Veo3效果依旧耐打,视频整体视觉效果流畅,画面连贯性比较好。色彩正常偏明亮,动作和表情也比较自然不僵硬。但是没有运镜,镜头语言比较单一。Veo 3 的真实感和流畅度确实都很好。
OpenAI的Sora在动态光效上的呈现能力确实比较强,画面非常协调,光芒以很柔和的方式随着液体闪动,桌面上的倒影也很线的视频流畅度比较好,桌面的倒影非常真实,会随着光线变化而变化。这显示了可灵对物理效果的理解。但茶杯内的流光有些单薄,没有完全达到提示词的要求。
即梦在动态效果上的表现也还是比较好的。视频流畅美观,色彩和谐饱和度高,运镜也非常自然,但是未能贴合提示词生成一个空茶杯,语义理解能力稍显不足。
经过一番体验,Bing视频生成器整体呈现的水平似乎还停留在2024年的水准。视频时长、画面比例、生成速度以及多模态融合功能上的明显短板,都让我感到力不从心。此外,它在处理复杂提示词时的准确性也难称得上满意,距离用户的期望值还有明显差距。
媒体VentureBeat 在一篇评论中直言:“Sora上市时万众瞩目,但不到一年,其光环已经大幅褪色。”Sora的发布频繁跳票,错过了AI视频产品的黄金发展期,其背后离不开大东家微软与OpenAI之间错综复杂的博弈。
微软与OpenAI在AI领域的合作关系,从一开始发展得非常要好到“心生嫌隙”,几乎贯穿了这款产品的研发周期。从2023年下半年开始,自OpenAI推出自有企业版产品之后,微软就不再“完全相信”OpenAI了。
在那场围绕OpenAI CEO 奥特曼的宫斗风波中,微软深度介入协调,但双方管理层之间仍旧出现了很多矛盾:员工之间互相不爽,OpenAI团队依靠自有技术高人一等,微软团队也对分享前沿技术持保守态度。这个时候,微软内部就已经有呼声希望尽快将Sora整合进产品线年,微软招揽Mustafa Suleyman负责自家AI业务,更加明确了“摆脱对OpenAI依赖”的意图。Salesforce CEO Marc Benioff更是爆料称,奥特曼与Mustafa Suleyman的关系不睦。
此外,Sora自身在安全性上的问题迟迟未能有效解决。YouTube曾公开指责Sora侵犯其数据版权。虽然一番风波中,有枪打出头鸟的嫌疑,但是自从Sora代号公布以来,麻烦确实不断。总结成一句话:微软想用Sora当王牌拯救产品线,OpenAI则碍于一系列考虑不断推迟。微软这回围绕免费版“Sora”推出的一系列市场推广动作,却让用九游娱乐文化 九游app官方入口户好感度骤降。比如,微软选择在Bing平台上线Sora而非旗舰AI平台Copilot,这是否是微软游移不定的最佳证明?再有,Bing上利用Sora视频生成时还需要赚积分操作,生硬的推广也让大家“愣神一秒”。
与此同时,市场上涌现了如Kling、Vidu AI、即梦、PixVerse、WanX、谷歌Veo、Luma和Runway等一大批优秀的AI视频生成工具。Kling早在2.0版本时便宣称在物理引擎和叙事连贯性上超过了Sora;谷歌的Veo系列甚至支持了高品质AI配乐和音效。
反观Sora,承诺的单次60秒视频生成至今未完全兑现,用户实际最多只能体验20秒的输出效果。可以说,如今的Sora虽然免费,但在技术表现和用户体验方面已很难与竞品保持竞争力。更何况,这一年中,中国厂商纷纷将成本压到什么等级,所有用户有目共睹 。
Sora就像达摩克利斯之剑,一直悬在国内外众厂商的头顶上。没人知道,Sora的到来,是否会瞬间变革一切。Sora本身的性能可以说仍在第一梯队,其流畅性一直被人津津乐道。这回有了微软这家“横跨PC时代,移动互联时代,云计算时代,并且在每一个时代都引领潮头的超级巨厂”在产品端的下场,Sora得到的助力将会远超以往。
Sora如果能获得一个宝贵的场景入口,可能就会从现在的困局之中抽身开来,转入新赛道。一个场景入口的重要性,我们其实已经在Anthropic的身上看到了。现在的AI大营销时代下,基础模型最怕的不是“技术落后一丝”而是默默无闻。“已经晚了”并不意味着没有机会了。
可以预计,微软开放 Sora 将迫使竞争对手们加速创新,推出更优服务。国内AI视频厂商想必都感受到了一些冲击。之前,他们通过快速迭代,从而在AI视频效果的各个领域积累起来的优势,俨然无法让大家继续安心前行。
这条路有多难走,国内大厂有话说。比如,百度CEO李彦宏就曾在2024年第三季度内部会上明确表示:“百度不碰 Sora 类的视频生成。”他认为To B业务应尽量避免那种“吃力不讨好”的定制项目,而应推出标准化产品。
阿里巴巴通义团队的AI视频生成模型WanX2.1的开源策略,也走出了一条独特的道路,在开源的领域蚕食关注力。
Sora会跑的多快?我们无法预测,但是中国厂商仍需提速。过去一年,谷歌Veo2、Veo3在性能上的领先幅度非常大,但高昂的成本令市场反应平淡;反而是价格适中、性能更均衡的Kling等产品大受欢迎,迅速积累了2200万用户。
版权所有:Copyright © 2024 九游娱乐 版权所有 粤ICP备19072226号