
在刚刚过去的一个月, 来自中国的一款视频生成大模型可灵成为全球范围内最受关注的 AI 产品
在刚刚过去的一个月, 来自中国的一款视频生成大模型可灵成为全球范围内最受关注的 AI 产品。创刊于 1899 年的美国权威技术杂志《麻省理工科技评论》在其官方网站刊文指出, 来自中国的新型「文生视频」人工智能模型「令人兴奋」, 由中国互联网企业快手发布的这款产品, 在行业里具有里程碑的意义——这是全球范围内首款可供公众测试的文生视频大模型产品。
过去两年多来, 从 ChatGPT 发布到视频生成大模型 Sora 问世, 都引发了科技界、产业界的广泛关注。Sora 的出现不仅推动了 AIGC 技术在全球范围的迈进, 也引发了对于中国在未来的全球 AI 竞争中, 是否还有技术创新能力的关注。
「可灵」大模型的发布不仅在国际大模型技术圈层展现了中国技术具备领先可能, 也在一定程度上加速了 AI 生成视频产品的竞争。如何看待人工智能对于新质生产力的正向作用? 下一步如何推动应用场景和商业化的应用? 围绕这一主题, 瞭望智库近期在京召开了「未来已来, 拥抱人工智能+新质生产力」课题研讨会, 国产视频生成大模型, 正在成为助力创作者和行业从业者提效的技术实现路径。
国产视频生成大模型海外爆红
从 ChatGPT 发布到视频生成大模型 Sora 问世, 来自美国的人工智能公司 OpenAI 牢牢占据 AIGC 领域的创新高峰。所有后来者, 不可避免地要接受来自科技爱好者、专业从业者以及行业的高标准比较, 甚至更多时候需要先突破大众「先入为主」的质疑。
国产大模型可灵 (Kling) 发布后, 美国著名创业投资公司 Y Combinator CEO 于 6 月 8 日在海外社交媒体平台转发并称赞了可灵生成的 Demo(样片);英国开源人工智能公司 Stability AI 前 CEO Emad Mostaque 表示:「中国的 AI 技术有自己的优势。」可灵在大幅度运动的合理性、物理世界特性的高度模拟能力, 以及强大的概念组合能力和想象力方面都获得了海外专业人士的认可。
美国科技媒体在对可灵的评价中, 也罕见地释放了同一信号:这是中国大型科技公司在人工智能 (AI) 应用领域努力赶上美国同行的最新迹象。比如, 硅谷的科技新闻媒体 The Information 将可灵评价为「让人印象深刻的」, 并称之为 Sora 的竞争对手。另一家美国科技媒体 Tech Radar 同样表示, 视频生成是下一个 AI 大战场,Kling AI 是一个令人印象深刻的新对手。
在媒体的报道中, 可灵最初被称之为国产版 Sora, 但来自海内外众多的产品测评显示, 国产版 Sora 的定义明显低估了可灵的能力。一家专注于人工智能研究的自媒体「The AI GRID」甚至在测评后, 直接给出了「Game Over」的结论, 表示中国最新的 AI 视频工具可灵已经全面战胜了 Sora。
可灵的出现, 也在一定程度上加速了 AI 视频领域的竞争。就在快手可灵上线一周后的 6 月 13 日,Luma AI 发布最新文生视频模型 Dream Machine, 向所有用户免费开放使用, 生成式 AI 平台 Runway7 月 2 日宣布, 其文生视频模型 Gen-3 Alpha 向所有用户开放使用。
业内人士认为,AI 大模型与全球生成式 AI 的行业生态和产业格局息息相关, 这也是可灵「一石激起千层浪」的核心原因。
人工智能发展如何走出「中国路径」
抢滩 AI 至高点过程中, 对中国 AI 能力的一个普遍判断是, 虽处于第一梯队, 但与 Open AI 等所代表的发达国家人工智能研发相比, 还处于追赶状态。以可灵为代表的国产视频生成大模型, 正在修正这一观点, 并给中国人工智能创新领域注入信心。
「应充分认识我国发展人工智能的优势。」十三届全国政协社会和法制委员会副主任陈智敏表示, 我国发展人工智能的优势有:党的集中统一领导, 新型举国体制, 集中力量办大事的优势;制造业的优势, 我国制造业总产值占全球比重达 35%, 为人工智能基础设施建设奠定了坚实的基础;民营企业敢闯敢试优势, 我国民营企业贡献 50% 以上的税收,60% 以上的 GDP,70% 以上的技术创新成果。
一个来自行业的共识是, 以可灵为代表的视频生成大模型, 早已突破「丰富创意库工具」层面的较量, 转向了「新质生产力工具」的革新。
「6 月份第一周, 可灵是世界第一。」长期关注人工智能应用的清华大学新闻学院教授沈阳表示, 在人工智能应用上, 要重视短视频领域和人工智能的结合。
「短视频占到中国网民上网的一半时间, 全世界现在慢慢也是这样。」沈阳表示, 目前大模型领域从应用的角度来看, 我们达到过世界第一, 如果继续强化, 还有可能在 Sora、Luma、Runway 的竞争下又走出一条路。
在快手研究院执行院长蔡雄山看来, 进一步做大做强国产文生视频大模型, 可以充分发挥短视频直播行业的优势。
「短视频直播生态具有应用场景多元、机制灵活、反应速度快等特点, 天然适合大模型训练和应用场景布局。」蔡雄山说, 可灵在海外引发的关注和业态竞争加速, 对于中国人工智能发展路径的启发是, 通往人工智能未来的竞争中, 算力的确是核心因素之一, 但研发所依赖的海量数据、产业积累、用户规模, 也是重要变量, 并导向不同的发展路径。
多位与会专家认为, 无论从战略布局还是产业参与看, 全球新一轮科技竞争中, 人工智能将走出「中国路径」, 即与产业的更紧密融合, 甚至直接脱胎于产业领域, 实现新质生产力引领下的高质量发展。
在这一点上, 视频生成大模型可灵的率先内测和应用, 恰恰切中了这个命题。可以说, 中国 AI 能力正在形成基础设施、技术研发、产业应用、用户驱动的多向奔赴, 而不是纯技术与算力的「内卷」, 这些都是中国在全球 AI 竞争中的优势, 也是一家民营企业能够推出第一个视频大模型产品的独特土壤。
作为新兴数字技术, 人工智能体现出了更高的自主性与拟真性, 让 AI 视频生成技术具有广阔的应用前景。
推动公共数据开放共享提升AI竞争力
通往人工智能未来的竞争中, 算法、算力与数据, 是支撑大模型发展的三大基石。更高质量、更丰富的数据是生成式 AI 大模型成功的驱动力。
蔡雄山认为, 人工智能研发与应用对资金、算力、数据的需求有目共睹, 尤其在突破前沿技术方面, 既需要持续的现金流和利润支撑, 又需要庞大的用户基数、数据沉淀和多元的应用场景。
十三届全国政协社会和法制委员会副主任陈智敏在研讨会上表示, 超大的市场、海量的数据要素、以及丰富的应用场景, 是我国人工智能发展的优势所在。
据了解, 中国的公共数据非常丰富, 在可公开获取的公共数据领域具有突出优势。有研究显示, 我国政府部门掌握的数据资源占据全社会数据资源总量的 50%—80% 左右, 但目前公共数据开放共享不够、数据利用率不高。我国公共数据开放共享还有很大空间。
针对「人工智能+新质生产力」的议题, 新质生产力从全新视角释放的新动能和新活力, 对生产力各要素提出新要求, 与会专家也提出了相关建议。
「实现数实融合, 我认为这是催生新质生产力的有效途径, 同时它也可以促进生产关系的完善、改进。」国务院发展研究中心原副主任侯云春认为, 首先要加强数与实的联手互动;第二, 精选慎选数实融合的解决方案;第三, 打通盘活数据要素;第四, 对于数实融合的失误和过程要提高容忍度, 允许试错。
来源:互联网