AI孙燕姿成今年爆火歌手,这一时代眼见不实,耳听为虚
(图片来源:摄图网)
作者|黄山明 来源|电子发烧友网(ID:elecfans)
就在近期,华语乐坛的不少歌迷喜气洋洋,认为目前的歌坛回到了20年前,歌迷们又享受到了许多动听的歌声。不过与以往不同的是,这些演唱者并非真人,而是一个个训练出来的AI。
这些AI足以以假乱真,通过技术将一首音乐以更换演唱者的方式来进行不同的演绎,不仅为歌坛带来了不一样的视听体验,同时也引发了行业对AI技术应用的思考。在AI时代,我们的所见所闻,或许都是由AI创造的。
光怪陆离的AI时代
如今的网络上有一个梗,要问今年哪个歌手最火,答案可能会出乎许多人意料,并不是某位歌手,而是一些由AI所制作出来的语音,如AI孙燕姿、AI周杰伦等。通过将原来歌手的声音进行采集训练,从而替换另一首歌的原唱。
通过这种方式,实现了让自己喜欢的歌手唱另一首自己喜欢但非歌手的歌,比如用孙燕姿的声音演唱周杰伦的《晴天》。关键在于,不论是演唱语调、技巧乃至音色,几乎都与孙燕姿相差无几。
实现这一技术目前已经有一套标准流程,先通过收集大量的音乐和歌词,并对这些数据进行清洗和标注,以便训练算法和模型。再选择合适的算法和模型,并进行优化和调整,以提高虚拟人物的歌唱和表演能力。
通过语音合成技术将文字转换为声音,并对声音进行处理和优化,以达到更加自然和流畅的效果。最后将原来歌曲的声音替换成语音合成的声音,再进行调试,就能得到一首全新演唱的歌曲。
既然都已经可以替换声音演唱歌曲了,那么更进一步替换视频画面进行演绎也就不太难了。近期谷歌的I/O大会上,便公布了一项Universal Translator技术,该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。
这意味着该技术不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情,人物说话视频会根据目标语言的发音同步改变口型。
当然,为了避免这项技术被用来制作虚假视频,谷歌将这项技术只授权给少部分的合作厂商使用,普通人是无法接触到的。但市场上如今已经有许多类似的AI出现,谷歌的此举不过是略作限制,但无法阻止这股趋势。
更有甚者,如一位美国网红发布了AI版本的自己“Caryn AI”,这个应用是一款聊天机器人,可以作为用户的虚拟伴侣,目前正在内部测试阶段,每分钟收费一美元。
据美国杂志《财富》披露,就在过去一周的时间内,这款软件已经为其创造了7.16万美元(约合人民币50万元)的收入,已经吸引了超过1000名付费粉丝。
这种模式或许也将冲击未来的娱乐行业,想象每一位追星的粉丝,只要付费,都将拥有与自己偶像一对一聊天的机会,其所创造的价值潜力将是巨大的。
但这种由AI所创造出来的音乐、视频、伴侣或者偶像,真的可以提供人们所需要的情绪价值吗?这是个值得思考的问题。
AI之后的隐忧
尽管这些AI应用的落地前景非常诱人,比如采用AI替换歌曲中的声音,就能够实现歌手只需要提供声音的模板,便可以进行批量的音乐制作。甚至不用自己演唱,也能够推行相关专辑。
技术上主要通过机器学习技术,训练机器模仿一个特定的歌手的音乐风格、声音和唱腔,然后将这些技能应用于其他歌曲的录制中。这种技术在一定程度上提高了录制歌曲的效率和质量,并且可以节省制作成本。
但如果使用他人的声音进行创作,就可能有侵权的风险。尤其在数据采集阶段,以语音替换为例,首先需要收集大量的语音数据,并对这些数据进行标注和处理。标注可以包括音素、语调、语速等信息,以便训练模型能够准确地识别和替换语音。
这一过程便可能涉及到对用户隐私数据的采用,甚至对用户的隐私和数据安全造成威胁,还有可能进一步造成财产安全。因为语音合成就可能被犯罪分子用于诈骗,通过合成亲属或者熟人的声音来谋取资金。
如果用AI更改视频画面甚至进一步篡改其中的对话,则可能造成更多的风险。比如将会遇到即便是用视频聊天,也无法确定对面的是不是真的想要联系的那个人。这项技术目前甚至已经应用在许多的直播平台中,比如一些虚拟主播、虚拟偶像等,如果一旦滥用,可能会造成更多的危害。
为了避免这一情况的发生,除了加强对AI技术的监管,建立相应的法律制度和规范,还可以通过一些技术手段来避免自身的数据被采集,从而造成侵权以及侵犯隐私的风险。比如采用区块链技术来保护数据的安全性和隐私性,采用人工智能算法来检测和识别恶意行为等手段。
以区块链技术为例,其去中心化和不可变性特点能够确保数据的安全和完整性,因此可以用于AI技术的安全验证和认证。基于区块链技术,数据交互和交流的过程被保护,因此可以授权AI对数据的操作并确保AI数据访问权限受到限制。
同时,区块链技术还可以帮助人们更好地控制AI技术的使用,并提高AI的公正和透明性。例如,以基于区块链技术的智能合约的方式来控制AI的使用,可以加强对AI系统的监督,并确保其行为符合人类的期望和价值。
当然,区块链技术还面临着可扩展性、隐私保护等问题,同时在操作成本和技术难度方面也存在一定的限制,还无法完全避免AI滥用的问题。
我们还可以运用数字签名技术检测音频和视频是否被AI修改,数字签名是指在文件中包含数字代码的技术,在将文件传输或转发给其他人时,可以验证文件的完整性和真实性。或者使用机器学习算法来检测这些变化,例如,可以使用深度神经网络来对音频或视频进行分析,以检测其中的模式和结构是否与人类创作者的作品相似。如果发现有明显的差异,则可能表明该作品是由AI生成的。
但随着未来AI技术的发展,这些差异化和容易被检测出来的问题都有可能被AI克服,使得我们最终很难分辨哪些产品是由AI制作,哪些才是由人所原创的。
写在最后
随着生成式AI技术的大爆发,如ChatGPT、文心一言、讯飞星火等聊天机器人的出现,让人们工作效率得以极大地提高,Stable Diffusion、Midjourney等AI的出现,让图片制作成本大幅降低,Universal Translator、Video Dubbing AI等,让视频也开始变得容易制作。
这些AI技术的出现显然极大的解放了人们的生产力,让人类发展走上快车道。当然有人会说以上这些AI都是通过收集大量数据之后,输出缝合之后的产品,根本不能称得上是原创。
但就像我们的学习过程一样,最开始都是模仿,后来才开始拥有自己的独立风格,但这些风格或多或少都会有之前学习过的影子,而这就是创造的过程,AI也是如此。
更值得关注的是,随着AI技术的快速发展,其所带来的风险也在与日俱增。如何更好的处理AI所引发的风险,将是我们未来所面对的主要问题。
编者按:本文转载自微信公众号:电子发烧友网(ID:elecfans),作者:黄山明
广告、内容合作请点这里:寻求合作
咨询·服务