中国首个Sora级少年阿bin 视频大模型发布自称性能国际顶尖水平

来源:网络更新日期：2024-04-27 21:38:38 点击：2004249

凤凰网科技讯（作者/于雷） 4月27日，在今日举行中关村论坛未来人工智能先锋论坛上，生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。Vidu是自Sora发布之后，全球率先取得重大突破的视频大模型，性能全面对标国际顶尖水平，并在加速迭代提升中。

","type":"text"},{"data":{"duration":91,"bigPosterUrl":"https://x0.ifengimg.com/ucms/2024_17/911A4667C3FC1A1189305196F8012F99585AA89E_size35_w1920_h1080.jpg","attachmentType":"video","fileSize":"13456","guid":"ae499454-8cc0-4bf6-a655-089194f49b58","audioFileSize":"1426","attachmentId":"ae499454-8cc0-4bf6-a655-089194f49b58","mobileUrl":"https://video19.ifeng.com/video09/2024/04/27/p7189824509258502844-102-113404.mp4","title":"中国首个长时长、高一致性、高动态性视频大模型，「Vidu」登场！","base62Id":"8Z64L4dK7y8","playUrl":"https://video19.ifeng.com/video09/2024/04/27/p7189824509258502844-102-113404.mp4","keywords":"模型架构模态 vit sora vidu 一致性视频动态性团队"},"type":"video"},{"data":"

该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT，支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界，还拥有丰富想象力，具备多镜头生成、时空一致性高等特点。

Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出，早于Sora采用的DiT架构，是全球首个Diffusion与Transformer融合的架构。2023年3月，团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser，率先完成了U-ViT架构的大规模可扩展性验证。

基于对U-ViT架构的深入理解以及长期积累的工程与数据经验，团队在短短两个月里进一步突破了长视频表示与处理的多项关键技术，研发了Vidu视频大模型，显著提升视频的连贯性和动态性。

Vidu的问世，不仅是U-ViT融合架构在大规模视觉任务中的又一次成功验证，也代表了生数科技在多模态原生大模型领域的持续创新能力和领先性。作为通用视觉模型，Vidu能够支持生成更加多样化、更长时长的视频内容，同时面向未来，灵活架构将能够兼容更广泛的模态，进一步拓展多模态通用能力的边界。

相关热词搜索：中国首个Sora级少年阿bin 视频大模型发布自称性能国际顶尖水平

上一篇： 全美高校反战抗议持续，美媒揭秘：这把火怎么点起来的？

下一篇： 雷军体验理想L6被李想关在车内？真相来了

中国首个Sora级少年阿bin 视频大模型发布自称性能国际顶尖水平

热门标签

全站热门

中国首个Sora级少年阿bin 视频大模型发布 自称性能国际顶尖水平

相关文章

造谣赵雅芝去世博主发文道歉：造成困扰对不起

激进式押注AI手机的厂商一大堆，为什么登顶的是它家

为打磨小米SU7细节：雷军曾买一筐手机支架逐一体验

特斯拉美国上调Model 3高性能版本价格

江西南昌一小区发生火灾 造成3人死亡2人受伤

江西南昌七旬老人照顾半瘫妻子13载 用爱诠释人间真情

江西文化观察：“唱游江西”如何化流量为“留量”？

各部门多举措保障百姓“五一”假期出行

（文化新纪行）传统遇到现代 江南古镇老街“圈粉”年轻人

江西一小区火灾致3死2伤

哈马斯代表秘密抵达北京，事先没传出任何风声

全总文工团推出歌曲《信心飞扬》MV唱响劳动之美

热门标签

全站热门

中国首个Sora级少年阿bin 视频大模型发布自称性能国际顶尖水平

江西南昌一小区发生火灾造成3人死亡2人受伤

江西南昌七旬老人照顾半瘫妻子13载用爱诠释人间真情

（文化新纪行）传统遇到现代江南古镇老街“圈粉”年轻人