生数科技CEO骆怡航:突破一致性问题加速AI视频商业化-新华网
2025 07/04 12:15:48
来源:2025全球数字经济大会

生数科技CEO骆怡航:突破一致性问题加速AI视频商业化

字体:

  7月2日至5日,2025全球数字经济大会在京召开。生数科技CEO骆怡航在接受新华网专访时表示,在Vidu视频大模型技术发展实践中发现,AI视频生成的核心问题是一致性,解决这一问题,就可以满足多种生产力场景包括广告、电商、动漫、文旅、影视等的创作需求,实现高效、低成本的规模化生产,加速AI视频的规模化落地。

  新华网:AI视频技术近期备受关注,但尚未大规模商业化。您认为当前落地难点何在?

 骆怡航:视频模型与语言模型的发展路径不同。语言模型商业化已快速落地,而视频模型仍处于商业化早期阶段。但实际上部分行业已加速渗透:互联网领域用户通过视频生成实现照片动态化、视频特效等互动;广告领域的电商商品介绍已广泛采用AI生产,甚至电视广告也在尝试AI;动漫行业因虚拟制作特性,AI显著提升了生产效率。文旅、教育、游戏、影视等行业尚未完全渗透,预计未来2-3年,八大行业三十余场景将随技术发展全面商业化。

  新华网:AI生成广告视频常面临主体一致性问题,生数科技Vidu技术是如何实现突破的?

骆怡航:一致性是视频生成的核心挑战。早期的文生视频技术因随机生成每帧内容而在生产力场景使用极少,图生视频需要关键帧的图片来保证连贯性,增加了一个生图再到图生视频的环节,耗时耗力。我们即将发布的“Vidu Q1 参考生”功能首次在业界实现突破:当用户上传人物、道具、商品或场景的主体图片后,生成的每一帧画面、每个片段乃至多镜头切换中,生成视频的一致性接近100%。这对商业创作具有决定性意义,没有一致性就无法应用于商业场景。

新华网:“Vidu Q1”模型如何推动商业规模化落地?较之前有何升级?

  骆怡航:规模化落地需要同时解决三大维度问题。效果维度,通过参考生视频技术实现主体一致性与专业级画面质量;效率维度,支持几分钟至几秒钟生成5-10秒片段;成本维度,将5秒单片段制作费降至几毛钱,较传统方式降低100倍。“Vidu Q1”模型在"好、快、省"三方面同步发力,这是加速商业化进程的核心基础。

新华网:目前广告产业仍依赖人工调校,未来AI+广告需突破哪些瓶颈?

  骆怡航:当前AI在精细化人物互动、商品操作等复杂场景尚有局限。“Vidu Q1”模型已解决基础需求,未来将通过双重路径演进:一方面提升基础模型的智能化能力,另一方面强化广告场景专项适配能力。值得一提的是,在本次全球数字经济大会上,我们与亚马逊云科技携手,基于Vidu在数字营销(广告营销)领域的应用合作也入选了北京市人工智能赋能行业发展典型案例(2025),这是双方在广告营销领域的成功实践,会为广告行业带来切实的落地成果。

  同时我们预计下半年至明年将在模型迭代及商业化中取得里程碑进展,通过与广告机构深度合作,吸收场景反馈迭代技术,逐步实现品牌广告的高复杂度与高精细度要求。

新华网:相比传统广告公司,你认为AI如何释放创意价值?

骆怡航:AI本质是人的"超级助手"。传统创意常受限于成本与周期,例如宇宙场景需影视级制作才能实现。而AI能以低成本、高效率将创意想象转化为现实,让人类创造力获得更大释放空间。我们倡导用AI实现更简单、更快速、更低成本的创意生产。

  新华网:生数科技Vidu 目前如何培育AI视频广告市场?

骆怡航:我们采取技术迭代与产品渗透双轨策略。持续升级多模态生成模型的同时,通过“Vidu”APP、SaaS平台、企业API等多形态产品降低使用门槛。针对广告行业专门开发了运镜、试穿、商品展示等模板,以“一键生成”这样快速的产品使用方式降低使用门槛,让技术真正融入千行百业。

新华网:在你看来,传统企业AI转型的关键策略是什么?

 骆怡航:必须紧扣业务痛点选择技术方案。企业应以解决场景需求为出发点,避免盲目追求模型指标。我们迭代模型的准则始终是解决产业痛点——AI作为新一轮生产力革命,唯有深入产业激发效率与活力才能实现价值。

【纠错】 【责任编辑:杨懿瑾】