AI换脸先驱的创造与搏斗:Deepfakes的过去、现在及未来
本文来源微信公众号:腾讯媒体研究院(ID:TencentMRI),作者: Will Knight
前段时间AI换脸软件“ZAO”上线,在引发人们追逐试玩的同时,也引起了人们对公众隐私权的讨论,但很少有人意识到AI换脸技术背后将会为现实生活带来怎样的影响。近期,《麻省理工科技评论》采访了“针幕动画”联合创始人黎颢,他的整个职业生涯都在追求完美的AI伪造技术,而如今,他正在努力解决现实生活中愈演愈烈的deepfakes相关问题。
本文由腾讯媒体研究院编译,作者为Will Knight,《麻省理工科技评论》人工智能领域高级编辑,介绍人工智能及相关领域的最新进展,包括机器学习、自动驾驶和机器人技术。

作者对这个人进行了换脸,看起来就像是Elon Musk在说话
今年6月的大连,黎颢站在一个有着尖角的巨大建筑内。天气闷热,安保严密,世界经济论坛的年度会议将在这里举行。
黎颢附近的展位很受欢迎,来自世界各地的政治家和企业CEO都在轮流体验。展位里笑声不断,因为他们的脸通过一种技术变成了一个个名人:李小龙、阿姆斯特朗或奥黛丽·赫本——这就是AI伪造,结果近乎完美。
这台不可思议的换脸机器不仅是为了供这些人娱乐,黎颢希望这些有影响力的人能考虑到AI伪造视频的后果——“deepfakes”,这可能对他们自己和我们所有人造成影响。
长期以来,虚假信息一直是破坏地缘政治的流行工具,如今社交媒体又成为假新闻传播的助推器。当假视频像假新闻一样容易制作时,这实际上就保证了它将被当做某种舆论武器。比如左右一场选举,毁掉敌人的事业和名誉,或者引发种族暴力。没什么传播工具比一段看似真实的视频更有效,它像野火一样在Facebook、WhatsApp或Twitter上迅速传播,且速度快到人们还没发现自己被欺骗就已经传播开来。
作为AI换脸技术的先驱,黎颢担心这只是后续影响的一个开端。尽管这个技术已经让人们认识到“眼见不一定为实”的现状,但他希望利用自己的技术来解决无处不在且近乎完美的AI伪造视频,这个问题迫在眉睫。但问题在于,会不会已经晚了?
01重写现实
黎颢并不是传统的deepfakes极客,他不会偷偷在Reddit上发布伪造过的明星色情片或者换掉著名影星Niklas Cage的脸。他的职业生涯始终致力于开发尖端技术,以更轻松、更逼真的方式伪造人脸。
他还在现代大片中篡改了一些在世界内具有极高知名度的面孔,欺骗了数百万人,让他们相信一个微笑或一个眨眼根本不存在。一天下午,他在洛杉矶的办公室里通过Skype聊天,不经意间提到威尔·史密斯(Will Smith)最近刚去看了他正在拍的一部电影。
演员经常来南加州大学(USC)的黎颢的实验室进行数字扫描。它们被放置在球形阵列的灯和机器视觉相机内,以捕捉他们的脸部形状、面部表情、肤色和纹理,甚至毛孔。然后,处理电影的特效团队就可以在后期制作中将演员添加到特效场景中。

如上图这种数字伪造视频的技术在好莱坞大片中很常见。很多电影背景都是利用数字技术制造出来的,将演员的面部替换到动作场景中的特技演员身上也是很常见的事情。这样观众就可以看到很多惊心动魄的电影情节,就像在电影《星球大战外传:侠盗一号》中,十几岁的莱娅公主在结尾短暂出现,但是扮演莱娅的女演员凯莉·费舍尔在电影拍摄时已接近60岁。
为了让特效效果更逼真,通常需要大量的专业知识和数以百万计的美元。但由于人工智能的进步,现在在一个视频中交换两张脸几乎变得微不足道,只需要一台笔记本电脑就可以了。你只要掌握一点额外的技能,就能让政治家、企业CEO或你的敌人说出或做任何你想做的事情(就像故事开头的视频中,李在我的脸上画了埃隆•马斯克(Elon Musk)的肖像)。
02AI换脸技术的历史
黎颢看起来比Sunset Strip更赛博朋克。他的头发剃了一半,经常穿着黑T恤和皮夹克。他说他有一种奇怪的习惯,就是在电脑前度过深夜。他并不羞于宣传他在技术领域的成功的或在工作中的成就。在谈话期间,他喜欢掏出手机给你看最近发现的一些新事物。

黎颢在德国萨尔布鲁肯长大,父亲是中国移民。他在法德两国的一所高中学习了四门语言(法语、德语、英语和普通话)。他现在都还记得让他决定研究现实与幻想之间界限的那一刻。
那是1993年,他在史蒂文·斯皮尔伯格(Steven Spielberg)执导的《侏罗纪公园》(Jurassic Park)中看到一块巨大的恐龙化石。当演员们痴呆地看着这只电脑生成的怪兽时,当时12岁的黎颢明白了科技刚刚让什么成为可能。“我意识到你现在基本上可以创造任何东西,甚至是不存在的东西,”他回忆道。
黎颢在苏黎世联邦理工学院获得博士学位,这是瑞士一所著名的技术大学,他的一位导师认为他既是一个聪明的学生,也是一个无可救药的恶作剧者。他学术论文附带的视频中包括了部分对他老师的讽刺。

保罗·沃克的弟弟在《速度与激情7》里为他的虚拟形象提供了一个模板基础
进入南加州大学后不久,黎颢创造了面部追踪技术,用于动作电影《速度与激情7》,为已故演员保罗·沃克制作他的虚拟人脸。这是一项巨大的成就,因为保罗·沃克是在电影拍摄中途意外出车祸身亡的,他的面部信息没有经过事先扫描,但还有很多场景需要他。黎颢的技术将沃克的脸替换到他的两个兄弟身上,这样他们就可以在200多个场景中轮流代替他。
这部电影的票房收入达到了15亿美元,是第一个重度依赖数字技术重新制作的大片。黎颢在谈这种AI换脸技术的时候,提到了沃克的虚拟角色,“连我都分不清哪些场景是真的哪些是假的,”他摇摇头说道。
03“你也可以是虚拟的”
早在AI换脸技术出现前不到十年,也就是2009年,黎颢开发了一种实时捕捉人脸并用它来操作虚拟模具的方法。这种方法使用了最新的深度传感器和软件将面部信息和表情映射到由可变形虚拟材料制成的模具上。
最重要的是,这种方法不需要在一个人的脸上添加几十个动作跟踪标记就能工作,这是一种跟踪面部运动的标准行业技术。李为Faceshift软件的开发作出了贡献,该软件后来作为大学的一个分支被商业化。该公司于2015年被苹果(Apple)收购,其技术被用于开发Animoji软件,可以让你在最新款iphone上变成会说话的便便。
黎颢和他的学生已经发表了数十篇论文:映射全身运动的虚拟化身、高度逼真的虚拟头发,以及用延伸真实皮肤的方式来模拟皮肤等。近年来,他的团队吸取了机器学习(人工智能的一个分支,机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法)的进步,尤其是是深度学习(机器学习的分支,是一种以人工神经网络为架构,对数据进行表征学习的算法)。他的研究也被应用于医学,帮助开发跟踪体内肿瘤的方式,并模拟骨骼和组织的特征。
如今,李在教学、为电影公司提供咨询以及经营一家名为Pinscreen的新公司之间奔波。该公司使用更高级的AI而不是deepfakes的虚拟化身。它的应用程序可以在几秒钟内将一张照片变成逼真的3D头像。它使用机器学习算法,这些算法经过训练,可以使用数千张静止图像和相应的3D扫描,将人脸的外观映射到3D模型上。这个过程通过所谓的生成式对抗网络(GANs)得到了改进(GANs并不用于大多数deepfakes)。这意味着,一种算法生成假图像,而另一种算法判断图像是否为假的,这一过程将逐步改进deepfakes。你可以让你的虚拟形象表演愚蠢的舞蹈、试穿不同的服装,你还可以通过智能手机上的摄像头实时控制虚拟形象的面部表情。
Pinscreen的一名前雇员,Iman Sadeghi正在起诉Pinscreen,声称它在2017年SIGGRAPH(计算机图形学顶级年度会议)上对该技术的陈述是假的。《麻省理工科技评论》杂志已经收到几位专家和SIGGRAPH组织的来信,他们驳回了这种说法。
此外,Pinscreen还与几家大牌服装零售商合作,开发了一种人们不用去实体店也可以试穿衣服的程序。该技术对于视频会议、VR和游戏的发展也很重要。想象一下,堡垒之夜的游戏角色不仅看起来像你,还会笑、会跳舞将会是怎样的一番场景?

使用Pinscreen制作的头像
然而,在deepfakes背后有一个重要的趋势:人工智能正迅速使高级图像处理成为智能手机信息世界的组成部分,而不仅仅局限于PC。由俄罗斯圣彼得堡一家公司开发的FaceApp,通过提供一键式的手机换脸功能吸引了数百万用户,最近也引发了争议。你可以在照片上添加微笑、去除瑕疵或调整你的年龄或性别(或其他人的)。而且很快更多的应用程序将提供类似的操作,到时你只需点击一个按钮即可生成你的虚拟形象。
但不是每个人都对这种技术的发展前景感到激动,黎颢和很多人“都在试图制作一次成像、可活动、实时生成的AI换脸软件”。专注于视频和人权的非营利组织Witness的主管Sam Gregory说:“当这种技术变得不易被操控并且会被很多演员接触时,我便开始担心这个技术造成的威胁了。”
幸运的是,大部分的deepfakes看起来仍然是不完美的。一张时常会“闪烁”的脸、一只“摇摇晃晃”的眼睛或一种奇怪的肤色都很容易让伪造内容被识破。但正如专家能够辨别出这些漏洞一样,人工智能的进步也将逐步改善这些细节,使deepfakes的制作变得更简单,也更难被发现。
黎颢即使在AI伪造视频方面取得了不俗进展,但他也会受到潜在危害的困扰。“我们正在面对一个影响深远的问题,”他说。
04伪造与检测间的较量
美国军方一个资金充足的研究机构DARPA也担心AI伪造视频的兴起。2016年,在deepfakes网站出名之前,DARPA推出了一项名为Media Forensics(MediFor)的计划,以鼓励数字取证专家开发一种能自动捕捉deepfakes图像的工具。人类专家可能会使用一系列方法来发现拍摄上的伪造,比如分析数据中的不一致性或特定像素的特征来寻找物理不一致性,即错位的阴影或不可能的角度。
MediFor现在的研究重点是检测AI换脸,从根本上来说检测比创建更难,因为AI算法可以学习如何去隐藏那些故障。早期的深度检测方法包括跟踪不自然的眨眼和奇怪的唇部运动,但最新的研究表明已经可以自动消除这些故障。
今年早些时候,DARPA MediFor的项目经理Matt Turek要求黎颢向MediFor研究人员展示他的伪造视频,最后与加州大学伯克利分校(世界上最重要的数字取证机构之一)的教授Hany Farid达成合作。他们现在正在进行一场“猫捉老鼠”的数字游戏,黎颢为Farid开发了deepfakes检测器并进行了改进。
Farid、黎颢还和另外几个人最近发表了一篇论文,讲述了一种新的、更强大的方法来检测AI伪造技术。它通过训练机器学习算法,以识别特定个体的面部表情和头部运动的习惯。如果只是将某人的面部替换到另一张脸上,那么伪造视频将很容易被检测出来。这需要大量的计算和训练数据,即真人图像或视频,来制作包含这些特征的AI换脸技术,但总有一天这种技术会变为可能。“可换脸技术也将在避开检测方面继续改进,”Turek说,“所以会有完美的监测方案吗?我对此表示怀疑。”
05Deepfakes会越来越完美
很显然,人们已经开始意识到AI换脸的风险。在我与黎颢会面之前的早晨,一位欧洲政客走进换脸展区,结果被他的伙伴拦了下来。他们担心该系统可能会捕捉到他的详细面部图像,让人们更容易伪造他的视频片段。
当我们看着人们在展位上玩AI换脸时,黎颢告诉我这种AI换脸视频从技术上来说不应该被检测到,“视频只是有颜色的像素,”他说。
让这种技术变得完美只是时间和资源的问题,而且他与Farid的合作表明,这越来越容易。“我们正在目睹AI伪造视频和检测伪造技术之间的竞赛,”他说,“正是基于人工智能算法的进步,才推动了这两种技术的发展。”
黎颢认为,未来他如果取得胜利的话,会是一个坏消息。但他估计在几年内就能实现“只需轻点一下屏幕就可制造无法被发现的deepfakes”。“对于这一点,”他说,“我们需要意识到我们看到的视频并非都是真的。”
广告、内容合作请点这里:寻求合作
咨询·服务
