智能应用 影音
MongoDB
ST Microsite

深度伪造技术

Nikola Tesla(1856~1943)在1890年代预言「21世纪时,机器人将取代古代文明中奴隶劳动所占据的位置。」

这项预言在当今的人工智能(AI)技术的发展下似乎正在实现。早期的AI技术已经能够大致准确地分辨狗和猫的图片,随着生成式人工智能(generative AI)的突破性发展,它逐渐深入我们的生活并引领着社会变革。当AI技术进入深度伪造(DeepFake)的层次,将会加速我们进入元宇宙世界,实现Tesla的预言。

深度伪造是一种透过电脑生成的影片技术,用于创造看似真实的虚假影像。它使用AI技术将一个人的脸替换为另一个人的脸,同时匹配微小的面部表情,从说话到皱眉都能保持一致。

这项技术利用深度学习算法和大量训练数据生成逼真的影片,使观众难以区分真实和伪造的影像。制作一个脸部交换的视频通常需要以下步骤:首先,使用编码器处理2个人数百万张的照片。编码器是一个AI系统,用于寻找并学习2个脸部之间的相似之处,并将这些相似之处简化为共同的特徵,并压缩图像。

然后,使用一个名为解码器的第二个AI系统,从压缩的照片中恢复出脸部。你训练一个解码器来恢复第一个人的脸部,另一个解码器来恢复第二个人的脸部,因为这两张脸是不同的。当需要进行脸部交换时,只需将编码的照片输入「另一个」解码器。

例如,将某甲的脸部压缩图像输入已经训练过某乙的解码器。然后,解码器使用某甲的表情和面部定位来重建某乙的脸部。为了制作逼真的影片,这个步骤必须处理每一帧画面。

现今,训练某甲与某乙脸部的模型,以及在影片中合并脸部的过程,几乎可以实时完成。

早期有名的深度伪造例子包括2个假影片:美国前总统Barack Obama称呼川普(Donald Trump)为「完全蠢货」和Mark Zuckerberg吹嘘对数十亿人的被盗数据拥有绝对控制。我们在乌克兰的战争中也见证假影片的应用,以及使用知名人物脸孔的成人内容。

然而,深度伪造技术也可能被用于音频和图像,大部分国家禁止未经同意且具有邪恶目的的深度伪造使用。

不过,除了潜在危险性,深度伪造技术在一些有趣且轻松的应用中也显示出潜力。例如,将深度伪造应用于教育领域,可以使课堂更有趣。想像一下,在英文课堂上,可以邀请虚构的名人来讲解课程,例如刘德华。虽然使用真实人物的深度伪造可能会被视为非法,但是使用不存在的人物则可以避免法律问题。企业也开发并销售深度伪造服务,以实现自动化新闻播报,甚至减少演员的参与,节省成本。例如,TikTok 上就有一个深度伪造的阿诺史瓦辛格(Arnold Schwarzenegger),使用俄语讲话,省去了他学习俄文的功夫。

深度伪造技术的应用范围广泛且多样,但我们必须谨慎使用,以避免滥用和潜在的负面影响。只有在合法、道德且有创意的方式下,才能充分发挥深度伪造技术的潜力。(作者为国立阳明交通大学资工系终身讲座教授暨华邦电子讲座)
 

Nikola Tesla。

现为国立阳明交通大学资工系终身讲座教授暨华邦电子讲座,曾任科技部次长,为ACM Fellow、IEEE Fellow、AAAS Fellow及IET Fellow。研究兴趣为物联网、移动计算及系统模拟,发展出一套物联网系统IoTtalk,广泛应用于智能农业、智能教育、智能校园等领域/场域。兴趣多元,喜好艺术、绘画、写作,遨游于科技与人文间自得其乐,着有<闪文集>、<大桥骤雨>。