本报讯 (记者李乔宇)9月11日,生数科技举办媒体开放日活动。当日,生数科技宣布,公司与清华大学联合研发的原创视频大模型Vidu“主体参照”功能正式发布。
目前来看,尽管国产视频大模型已经取得了颇为亮眼的成绩,但连续性弱以及输出随机引发的不可控问题仍然限制了AI生成视频的剧情连贯性。此次,生数科技发布的“主体参照”功能,意在通过锁定用户上传的图片,保证该主体形象的一致性,并围绕该主体形象生成视频,以此最大限度地保障AI生成视频的稳定性和可控性。
生数科技联合创始人兼CEO唐家渝告诉《证券日报》等媒体记者,“主体参照”功能摒弃了传统视频大模型的分镜头画面生成步骤,通过“上传主体图+输入场景描述词”的方式,直接生成视频素材。这一创新方法不仅大幅减少了工作量,还打破了分镜头画面对视频内容的限制,让创作者能够基于文本描述,发挥更大的想象力,创造出画面丰富、灵活多变的视频内容。在他看来,这一突破将为视频创作带来更大的自由度和创新空间。
“主体参照”功能也有望为AI生成视频进一步开辟商业化市场空间。唐家渝认为,该功能在商业广告片方向展现了强大的潜力。“广告片的一个重要要求在于要保证不同场景下品牌物形象的一致性。Vidu‘主体参照’功能能够很好地满足这一要求。”唐家渝表示,同时从完成效率来看,生数科技现场展示的一段跑步鞋广告,基于主体参照新功能,包含前期策划、素材生成以及后期剪辑,仅需一位工作人员6个小时的时间。
9月11日,生数科技也推出了合作伙伴计划,首批合作伙伴包括开心麻花、猫眼娱乐、巨人网络、美克家居、融创文化、河南省非物质文化遗产保护和智慧化中心、李可柒画院等企业与机构。
(编辑 张伟)