《流浪地球》系列导演郭帆的发言,让会场里响起了一小阵笑声。
这不是上海国际电影节的会场,而是 2023 年世界人工智能大会 WAIC 下午的主论坛。在这场名为「科学前沿」的会场中,和郭帆导演对话的是中国工程院院士张亚勤,一位多年从事人工智能的专家。
两部《流浪地球》影片票房超过 100 亿元,让郭帆成为中国科幻的代言人,当天他也和张亚勤就科幻电影如何启发现代科技,以及 AI 如何影响影视行业发展等话题展开探讨。
郭帆直言自己感受到了 AI 的威胁,不然不会来到现场。他提到,测试中,将人工绘制和机器生成的图像混合在一起,让导演选择他们喜欢的图像,结果第一批被刷掉的是人工绘制的图像,「那些学习了十几二十年的艺术家们未来应该怎么办?」
郭帆还从大会中寻找《流浪地球 3》的灵感。他问张亚勤院士,当人工智能「涌现」出意识后重新定义这个世界,我们怎么办?张亚勤安慰前者说,硅基生命永远没有真正的情感和意识。
张亚勤(中)与郭帆(右)对谈 AI 与科幻|WAIC 2023
主持人:电影和科学之间的距离非常近。想请问郭帆导演,无论是刚才我们发布的内容,还有各位科学家分享的内容,您认为现在的这个发展和我们以电影为例,各种视听的产业的需求,我们人工智能和日常生产消费的需求有没有距离?如果有的话在哪里是这样?
郭帆:我首先解释一下我为什么会出现在这个地方,在座有很多的同学们,我跟他们是一样的,我这上面写的是一个嘉宾证,我觉得应该改成学生证。
我刚才看到我们上海人工智能实验室的发布过程,我从我的感受上是震撼和骄傲的,我觉得这么短时间之内我们能有这样的一个成就。同时也在这个发布的过程中我在反思自我,之前对 ChatGPT 都是那种命令式的说你帮我干个这个,下回我在前面一定要加个「请」,结束了之后我说「辛苦了」,我觉得我要对人工智能好一点,给自己留条后路。
我就您刚才提出这个问题来说,实际上在电影《流浪地球 3》中,演员的增龄和减龄,都是就是年轻和变老的过程,是通过人工智能运算,经过了几百代的迭代才最终生成。此外,一些演员声音的修复也是通过这种方式实现的。所以,我们已经在实际应用中使用了人工智能技术。
我们今天看到的所有由人工智能生成的图像和视频,其实已经对我们产生了很大的影响。虽然它们的精度目前可能还没有达到电影级别,正如张教授刚才所说的,但我认为未来会达到那个水平。因此,我们现在还有时间去探索这个领域。在这个平台上,我和我的团队希望能够更多地了解新技术的发展,包括人工智能。但首先,我们需要重新认识人工智能,了解它是什么,它的底层逻辑是什么,才能探讨它未来的发展方向。我们作为学生,坐在这里是来学习的。
主持人:我追问一个,那您对于生成式人工智能的未来有没有什么样的期待?比如在电影制作中。
郭帆:我们经常会讨论,包括生成视频,包括如何解决视频中的闪动问题。这些问题逐步被解决后,我们可以看到更加稳定的视频镜头。未来,因为电影就是由镜头组成的,我们有可能会节省更多的时间和资金成本。但同时也存在危机感,因为这可能会对我们这个行业的很多部门和艺术家造成冲击。
主持人:你认为有哪些领域是我们艺术可以反哺到科学创新的?或者说有没有一些灵感是来自于电影和艺术,这两者之间除了提供技术解决方案之外,还有其他关系的可能性?
实际上,我们现在希望更多地了解人工智能的应用。我们已知的大约有 24 个应用领域,我们希望在未来的短片和电影计划中,从前期的创意阶段到剧本、实际拍摄、后期制作以及宣传和发行阶段,找到每个领域中对应的应用。然后我们会进行测试,看看哪些部分是可用的,哪些部分可能需要更多时间。
这是我们在未来半年多时间内计划要做的事情。我们希望能够进行更多的考察,了解新技术的发展方向。比方说,我们有一些关于流程和管理的需求。当我们拍摄《流浪地球》的第二部时,现场人员已经达到了 2200 人,整个团队规模接近 3 万人。因此,我们急需一个庞大的流程管理系统来支撑这个项目。
按照传统的制片逻辑或拍摄逻辑,我们缺乏这方面的经验。传统的剧组组织架构难以完成这样大规模的人员协同工作。我认为未来可能会有不同的形态。因为我相信一个基本规律,即生产力决定生产关系。
当我们的生产基础达到这个程度时,未来的剧组可能不再像今天一样需要几千人在现场,而是通过技术流程的辅助,能够让上万甚至上百万人同时协作。这部分需求可能还挺高的,因为我相信只有这样的细分,才有可能将我们的电影工业化从 2.0 尽快推向 3.0。
我简单介绍一下,刚才突然提到了 2.0 和 3.0。我们可以将电影工业化的三个阶段简单理解为:从电影发明到胶片时代到数字时代的迭代,大概持续了 100 年。胶片时代是工业化 1.0,胶片时代逐渐淡出,数字时代逐渐崛起,可以理解为工业化 2.0。现在,随着人工智能的发展,特别是如果出现通用人工智能 AGI,它将引领整个电影工业化迈向 3.0。
对于 3.0,我们需要思考如何进行创作和拍摄,如何进行后期制作、宣传和发行,甚至放映端和影院的形态也可能发生变化。比如,我们看到了 Apple Vision Pro 的发布,这是否会改变我们的观影模式?因此,我们需要理解和认知 3.0 的到来。
我们希望能够更快地与更多像张院士这样的科学家和人工智能企业接触,并进行更多的学习和交流,以便尽快建立工业化 3.0 的雏形。
「我感受到了威胁」
主持人:在人工智能的研制以及您接触到人工智能的进展中,您有没有感觉到人工智能对自己的挑战或者是威胁,无论是作为艺术创作者还是作为科学家?您是怎么感受到这个瞬间的?
刚才你提出的那个问题,我觉得我把你的问题给理解错了。你刚才提到的科幻作品怎么反哺,我想成科幻电影了。比如克拉克和阿西莫夫等大师确实给我们科学界也提供了不少有意思的启发。我只是在想,如果我们的电影可能还达不到这个程度,就是目前至少我拍的这部电影可能还不能回答这个问题,我们还在不断学习中。
你提到的威胁当然是存在的。我举一个例子,比如现在 midjourney 生成的这些概念设计以及分镜等等,我们想知道背后的概念师应该怎么办?在最开始做概念设计时,我们通常会把一段文字描述转换成一个大致的意向并形成画面。但是现在已经完成了这些工作,只需要输入几个关键词,就可以让系统生成图像。一个非常优秀的概念设计师可能需要一周时间才能画出一张图像,并且需要十几年甚至二十年的经验才能掌握这项技能。但是 AI 可以在一晚上生成一两百张图像。
当然,之前海外也做过这么一个测试,说人工智能的绘画我们经常会说它没有灵魂,对吧?我们也做了这么一个测试,将人工绘制和机器生成的图像混合在一起,让导演选择他们喜欢的图像。结果第一批被刷掉的是人工绘制的图像。前几天我们跟刘慈欣老师也聊天,也在说 AI 进行的小说剧本写作,能不能达到灵感乍现特别棒的这些作品,可能达不到,但是它确实是在一定水平线之上的,还是可以看的。
然后包括刚才说的这个图画的生成,绘画的这些生成,包括一些视频的生成,包括一些修改,所以这些应用已经开始逐渐地进入到我们电影制作领域中了。
我们其实还有一点焦虑,就是当我们这些功能使用得越来越多的时候,那些学习了十几二十年的艺术家们未来应该怎么办?
张亚勤:肯定有些工作可能会消失,但整体来讲,我觉得文艺创作、特别是电影,最大动人的地方还是故事情节、灵感、人性和情感。这些才是它的生命力。
用 ChatGPT、StableDiffusion、Midjourney 这些 AIGC 工具创作的东西,我觉得是没有生命力的,有也是人赋予他的这个灵感。
比如说我看到《流浪地球 2》里面的这个 MOSS,我觉得 MOSS 做得特别好,就包括有不同更多的迭代,然后它会自我地去升级,然后会获得更多的智慧。
其实这些技术基本上都能做,比如语音合成、自然的交互、不断地学习等等。但是它有一点是永远做不了的,就是它自有自我意识和情感。我刚才讲到这个通用人工智能 AGI,我一定要把它定义在感知和认知这两个层面上,它的能力可能和人一样强势,超过人的智能。但是我们现在所有这些算法,所有所谓的硅基生命永远没有真正的情感和意识,这也是最大的区别。
AI 给「浪球 3」带来灵感
主持人 :科学发明创造需要开源共享,它才能不断地迭代,不断地精进,但是艺术创作,尤其是艺术家需要版权保护。这两者之间怎么来调和?
郭帆:版权保护?我刚才一直在沉浸着张院士说的,以及刚才郭校长在台上讲,系统的复杂程度高到一定程度时,它会「涌现」。我们现在先跳开这个知识产权保护,因为面对这个「涌现」的问题来讲,知识产权保护可能是要排在后面了。
就是当这个系统足够复杂的时候,我们怎么去控制「涌现」。我们刚才去讨论所有东西,我们会站在一个人类中心论的逻辑上去看待这个东西。比方说我们的情感是什么?比如说 mind 的是什么东西,那么这个定义权在我们自己手里。
那么如果当「涌现」真正产出意识之后,他们如果重新定义这个世界,重新去建立我们这个世界的意义框架的时候,那个时候我们怎么处理?我特别想问一下张院士。
张亚勤:我认为现在我们讲的这个属于智能涌现,不会产生意识。现在智能涌现是模型的参数,这个大到一定程度的时候,我们所完成的很多任务都会变得十分准确,但是并没有说我们会有新的意识的产生,或者是产生新的一种情感。有的时候我觉得我们给出的这个词汇会有一些歧义。
我们可能不知道为什么会出现这种情况,至少不是 100% 知道他的推理过程怎么涌现的,但是这个和完全和我们对自我意识、独立意识没有关系。
其实这些技术基本上都能做,比如语音合成、自然的交互、不断地学习等等。但是它有一点是永远做不了的,就是它自有自我意识和情感。通用人工智能 AGI,我一定要把它定义在感知和认知这两个层面上,它的能力可能和人一样强势,甚至超过人的智能,但是我们现在所有这些算法,所有所谓的硅基生命永远没有真正的情感和意识,这也是最大的区别。
郭帆:人工智能的「涌现」现象背后的可怕逻辑在于,我们不知道它为什么会产生这样的结果。就像我们经常看到一群蚂蚁,单个蚂蚁的能力非常有限,但当它们聚集在一起时,就会表现出很多特殊能力,这些能力也会出现在一些鸟类等生物身上。当个体和群体聚集在一起时,整个系统复杂到一定程度时,「涌现」的结果非常有意思,这与我们现在所谈的人工智能中的「涌现」非常接近。
当然我觉得这个是咱们探讨一个现实的部分,我们也许在未来我们再去做《流浪地球 3》的时候,这个概念也可以放在里边。