4A广告网 - 广告营销行业影响力媒体_广告创意_营销策划_公关传播

中国首个Sora级视频大模型「Vidu」 发布,可理解中国元素

张小虎
2024-04-28 14:20

4月28日消息,昨日在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu

据悉,Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达16秒、分辨率高达1080P的高清视频内容。

根据现场演示的效果,Vidu能够模拟真实的物理世界,能够生成细节复杂、并且符合真实物理规律的场景,例如合理的光影效果、细腻的人物表情等。它还具有丰富的想象力,能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容,例如“画室里的一艘船正在海浪中驶向镜头”这样的场景。

此外,Vidu能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同 镜头的切换,包括能直接生成长镜头、追焦、转场等效果,给视频注入镜头语言。

作为中国自研视频大模型,Vidu还能理解中国元素,能够在视频中生成例如熊猫、龙等特有的中国元素。

1-800.jpg

Vidu宣传视频截图

自今年2月Sora发布推出后,团队基于对U-ViT架构的深入理解以及长期积累的工程与数据经验,在短短两个月进一步突破长视频表示与处理关键技术,研发推出Vidu视频大模型,显著提升视频的连贯性与动态性。

“Vidu的命名不仅谐音‘Vedio’,也蕴含‘We do’的寓意。”清华大学教授、生数科技首席科学家朱军表示,模型的突破是一个多维度、跨领域的综合性过程,需要技术与产业应用的深度融合,希望与产业链上下游企业、研究机构加强合作,共同推动视频大模型进展。

SoraViduSora级视频大模型视频大模型创意视频视频制作
1、该内容为作者独立观点,不代表4A广告网观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、如对本稿件有异议或投诉,请联系:info@4Anet.com
2月28日,Stability AI在其官方社交账号上宣布与领先的text-to-video公司Morph AI达成合作,双方基于各自的模型优势,共同推出了一款all-in-one(一体式AI视频创作) 的制作工具——Morph Studio。官方称,该工具将颠覆传统视频制作流程,具备了让创作者能够在一个界面中完成生成、剪辑和后期等的便捷功能,支持创作者调用AI模型选择每一个镜头并达到最佳效果。
最近,Sora模型的相关话题火爆网络。这边注意到,近日,抖音知识网红李一舟通过卖AI课被推到了话题浪尖。日前,一张“李一舟某个AI实战训练营群疑似被助教解散”的群聊截图在网络流传,引发关注。近,有一些不同的声音发出,不少购买了课程的用户提出了有关课程质量的质疑。与此同时,有网友发现其履历与AI行业似乎并不相关。
Adobe视频截图据悉,这款新工具将与第三方平台如Runway、Pika Labs和OpenAI的Sora模型整合,赋予用户利用文本提示创建视频内容的能力,同时添加或移除视频元素,类似于Photoshop的内容感知填充功能,并可灵活调整视频长度。Adobe 展示了今年为 Premiere Pro 带来的生成式 AI 视频工具:不同于Adobe此前关于Firefly的公告,这一次公司尚未宣布这些视频生成工具的具体上市时间。Adobe表示:AI的力量能极大提升生产效率并降低进入新媒介工作的门槛。
近日消息,字节正式发布文生图模型 SDXL-Lightning。 据官方信息称,SDXL-Lightning 通过一种创新技术——渐进式对抗蒸馏(Progressive Adversarial Distillation)——突破了这一障碍,实现了前所未有的生成速度。该模型能够在短短 2 步或 4 步内生成高质量和分辨率的图像,将计算成本和时间降低十倍。我们的方法甚至可以在 1 步内为超时
近日,美国开放人工智能研究中心OpenAI,发布了首个视频生成模型Sora”,引发行业内外广泛关注。然而,近期,网络上流传除了Sora各种不符合现实的图,引得网友爆笑。连LeCun、DeepMind大佬、马斯克都纷纷下场了,而一位动画师表示,自己完全不担心被Sora淘汰。
以 ChatGPT 闻名的人工智能公司OpenAI 宣布推出首个文生视频模型Sora,能够根据输入的文字提示生成简短的 1080p高清流畅视频
Sora还未走远,Kimi又袭来。Kimi的爆火点燃了投资者们的热情。3月21日,易点天下在互动平台表示,公司已接入Kimi Chat。
近期,Sora视频生成模型拉升了大众对AIGC视频商业化应用的期待。 作为营销行业AIGC应用模型,InsightGPT基于开源自研的视频生成算法+行业视频库形成的营销创意视频算法,目前已经具备有营销行业属性的图生视频的能力,已上线「AI卖点视频」和「AI动效海报」两子产品并正在邀请特定用户体验。
ai共创,思路打开。