AI 造假已经越来越熟练了,以后我们真的不能再用「眼见为实」来证明一件事的真假了。
当别人从你的社交网络上抓取一张照片,他能做些什么?
给你 P 出各种表情?加上有趣搞笑的滤镜?如果你以为只是这样那就大错特错,因为通过 AI 技术做出一段惟妙惟肖的假视频,然后让朋友误以为真的是你,这件事如今已经不再只是科幻。
你没听错,这不是电影,而是 AI 技术又一次新尝试。来自俄罗斯三星实验室的研究员新开发的一项 AI 技术,只需要某人的一张照片,就能带来一段活灵活现的视频内容。这种技术甚至能让蒙娜丽莎开口说话,就像下面视频中这样:
通常,要做出以假乱真的 deepfake 视频需要大量数据支持。比如早前我们曾经介绍过利用深度学习技术,有人为色情演员加上了好莱坞明星的脸,盖尔·加朵、艾玛·沃森被「移花接木」到了色情视频当中。
这样的换脸技术本身是通过机器学习来对大量素材训练,通过生成式对抗网络(GAN)将目标对象替换成自己需要的对象图像,甚至如果数据资料够多,它还能将图像、声音等完全伪造。但如今,新的 deepfake 技术不再需要大量数据,甚至一张普通照片就能伪造一段视频。
研究人员先是从 YouTube 上搜集的 7000 多张名人照片进行进行面部特征提取,包括脸型、眼睛、嘴型等特征点,通过这些特征点进行的训练去比对拍摄的照片,并让这些拍摄的照片动态头部模型,通过一系列卷积运算让比对效果不断提升,最终在进行前期大量学习训练之后,新的神经网络只需要少量数据和就能生成新的人脸信息甚至是视频。
听起来有些复杂,但实际效果却是肉眼可见的明显,不仅仅是《蒙娜丽莎的微笑》中角色可以开口出现表情动作,就连阿尔伯特·爱因斯坦、萨尔瓦多·达利等也都可以从静态肖像活灵活现出现在你的眼前。
当然,和大多数 deepfake 生成的视频相似的问题是,三星的研究人员做出的这些视频现在看来并不完美,你依然能看到有缝隙、动作古怪甚至有点像家地,但伴随数据训练越来越多,这样的问题将会被改善。
研究人员表示,这项研究可以运用在娱乐领域,比如像《哈利·波特》电影中那样让静态肖像画活动起来。但这毫无疑问也为人们带来了一些担心,既然一张照片就能伪造成一段视频,那么未来这样的技术是否会对我们产生危险?
关于这一点,达特茅斯学院媒体取证专家 Hany Farid 就谈到:「deepfake 这样的技术在如今的趋势下,需要的相关数据越来越少,将会导致未来创造内容真假难辨。」这一点也是让人所担心的,也许犯罪分子会通过这样的技术来进行犯罪。
不过三星的研究人员目前希望这样的技术能够实现更大突破,并且有机会被应用于电子游戏、电影、电视等领域,对于特效行业来说,这样的技术会降低不少成本。而随着反作弊技术的进步,对于这些伪造视频的判断将会更加精准,现阶段观察并讨论它的适用范围是我们更该做的事情。
消息来自 CNET