让去世亲人“复生”？这项新技术做出的假视频口型和声音几可乱真

Winnie Lee2018-09-05 09:34

前瞻经济学人

一款新的应用声称可以使用一种全新的视频系统让死者“复活”。

谷歌的工程师Supasorn Suwajanakorn开发了一种工具，通过正确的输入，可以创建一个逼真的假视频。通过仔细观察现有视频片段中某个人的嘴和牙齿，模拟某个人说话的方式，从而创建完美的唇形和声音同步。

他警告说，它可以被用来制作死去亲人的视频，也可以被用来制作极为逼真的“深度假视频”，以达到邪恶的目的。

Suwajanakorn说，这种技术可以用来为那些已经去世的人创建虚拟的版本——人们可以向祖父母寻求建议;演员们回到银幕上;好老师再度给学生上课，或让作家大声朗读他们的作品。

“如果能向我们的祖父母寻求建议，听他们安慰的话，即使他们已经不在我们身边，那岂不是很棒?”他今年早些时候在温哥华的TED大会上说。

不过，他也透露，他还开发了一款“现实卫士”(Reality Defender)应用程序，用来识别使用该技术制作的极其逼真的“深度假视频”。

“我们的目标是为人们建立一个准确的模型，而不是误导他们。但我担心的一件事是它可能被滥用。自从Photoshop首次上市以来，人们就一直在思考这个问题。”

“作为一名研究人员，我也在研究对策，我的工作也是人工智能基金会(AI Foundation)正在进行的工作的一部分。该基金会利用机器学习和人类版主的结合，来检测虚假图像和视频，这款视频工具也在针对列表中。”

“我们计划发布的工具之一是‘现实卫士’，这是一个网络浏览器插件，可以在浏览器中自动标记潜在的虚假内容。”

“但我很兴奋，也深怀希望，因为如果我们正确、谨慎地使用它，这个工具可以让任何个人对世界的积极影响大规模地扩大，并真正帮助我们以我们希望的方式塑造未来。”

这种制造视频的人工智能是如何工作的?

由华盛顿大学(UW)的研究人员开发的口型同步系统，将语音文件转换成真实的嘴巴形状，然后将这些从另一个现有的视频移植到那个人的头上。

第一步是训练神经网络来观看一个人的视频，并将不同的声音转换成基本的嘴型。

前瞻经济学人

然后，通过在UW的图形和图像实验室团队的研究基础上，采用一种新的嘴部合成技术，研究人员能够将真实的嘴部形状和纹理叠加并混合到那个人的现有视频上。

这项技术的另一个重要方面是允许一个小的时间偏移，这样神经网络就可以预测说话人接下来要说什么。

Suwajanakorn说，他的灵感来自一个见证(Testimony)项目中的New Dimensions部分，这个项目可以让人们与大屠杀幸存者的全息图对话。

“这些结果看起来很有趣，但同时也很麻烦;这让我担忧，可能这项技术会被滥用。”

例如，他担心战争可能由一个世界领导人宣布核打击的虚假视频引发。

这款名为“真实卫士”(Reality Defender)的设备可以自动扫描被操纵的图片或视频，并允许用户报告明显的谬误，从而利用人群的力量来加强防御。

他说：“我们必须冒着风险完成它，而且成本效益很低。”

据Suwajanakorn说，虽然写假新闻可能既便宜又容易，但要在没有任何痕迹的情况下操纵视频却很困难。

他认为，从设计上来说，视频是由成千上万张图片组成的流，每一张图片都必须用赝品加以完善。

Suwajanakorn说，要想有效地为人们树立榜样，还有很长的路要走。他在这一领域的工作源于他在华盛顿大学(University of Washington)读书时的经历。

“我们必须非常小心;我们不希望它落入坏人之手。”

广告、内容合作请点这里：寻求合作

咨询·服务

相关阅读