今日,生数科技联合清华大学发布了其最新的视频大模型“Vidu”,这一成果在AI视频生成领域引起了广泛关注。据悉,“Vidu”支持一键生成长达16秒、分辨率高达1080p的高清视频内容,在多镜头语言、时空一致性等方面表现出色,其效果已经逼近了全球领先的视频大模型Sora。
“Vidu”的发布标志着国内在视频大模型领域取得了重要突破。在短短两个月的时间内,生数科技团队就实现了这一令人瞩目的成果,展现了他们在AI视频生成技术上的深厚实力。
据悉,“Vidu”采用了自研的U-ViT架构,通过大规模训练实现了长视频生成。同时,该模型还复用了图文任务经验,提升了训练效率,使得视频生成更加快速、高效。
在视频效果方面,“Vidu”展现出了出色的性能。它不仅能够生成多镜头语言、时空一致性的视频内容,还能够虚构出真实世界不存在的超现实主义画面,这一点在当前的视频生成模型中十分罕见。这些特点使得“Vidu”在视频制作中更具灵活性和创意性,能够满足更多复杂和精细的视频需求。
此外,“Vidu”的发布也体现了国内在AI视频生成领域的创新活力。随着技术的不断发展,越来越多的企业和团队开始投入到这一领域的研究和应用中,推动着AI视频生成技术的不断进步和升级。
生数科技联合创始人兼CEO唐家渝表示,他们将继续致力于提升“Vidu”的性能和应用范围,以满足更多用户的需求。同时,他们也希望能够与更多的合作伙伴共同推动AI视频生成技术的发展和应用,为人类社会的进步贡献更多力量。
总的来说,“Vidu”的发布是国内在AI视频生成领域的一次重要突破,它不仅提升了国内在这一领域的技术水平,也为未来的视频制作和创意产业带来了更多的可能性。我们期待“Vidu”能够在未来继续发挥更大的作用,为人类社会的文化、艺术和科技领域带来更多的创新和惊喜。
文章来源于互联网:科技云-视频大模型“Vidu”发布:一键生成16秒高清视频,逼近Sora水平