重新去中心化数码科技强化国人隐私保护
- 林佩莹/台北
人工智能(AI)技术所发展的多样化智能应用驱动科技产业快速发展,AI技术是由数据定义的程序码来运作,因此数据蒐整合为AI应用发展的关键,对于健康医疗大数据分析、精准医疗等重要的先进医疗与创新应用,皆需仰赖高数量数据做为开发基础,但隐私保护的疑虑让数据提供者产生担忧,而降低数据品质或提供意愿,进而产生一连串恶性循环,所以强化隐私技术的重要性,除了关系着个人隐私保护外,对于国内AI技术能否顺利发展有重大的意义。
现今的数码架构是将数据储存与传输集中在关键的服务器端点上,个人数据保护法在2012年制定,政府也在法规监理上透过数码科技做出更大的保护,针对具争议未去识别化处理的数据内容,因为缺乏独立专责监管机构,恐有泄露之虞,碍于立法与凝聚共识的不确定时间,于是期盼透过数码科技先行,转而寻求藉由隐私强化技术(Privacy Enhancing Technologies;PETs)的协助,建立技术上的防线,以驾驭数码时代的信息安全需求。
行政院政务委员唐凤表示,看到PETs科技上的潜力对隐私保护取得重要进展,他提出「重新去中心化(Re-decentralization)」的概念,提供政府做为施政时的重要辅助技术。这种能保护民众隐私权的先决条件下,协助公共政策的执行,对保护个人数码信息上有重要的贡献。考虑到民众通常不会感受到技术隐身其中所扮演的角色,唐凤以最近的简讯实联制范例进一步说明这个技术的实用性。
简讯实联制采用重新去中心化概念 成为隐私保障典范
COVID-19(新冠肺炎)将隐私保护技术推上防疫第一线,藉由数据串联辅助疫调,一举让科技防疫介入公卫医疗系统。2021年疫情的疫调工作,政府推动简讯实联制防疫管制措施。民众进入商店时,无需另外下载App,只需使用手机扫描QRCode、传送简讯至「1922」,即可将个人移动足迹纪录,提供给指挥中心防疫使用。
简讯实联制将民众足迹的个资转换成代码,透过简讯数据在运营商的云端机房存放28天,简讯数据放在不同运营商的不同平台中。这个概念类似于安全多方计算(Secure Multi-Party Computation;SMPC)协议,只有当疫调人员需要查核足迹时,才将散落在不同平台上的加密数据组合起来,像拼图一样拼贴个别信息片段,再经过编译才能解出完整数据与地点的信息。
流程中的任何一方,都只能看到无意义的片段:店家无法取得民众的手机号码,运营商也无法解锁商家的场所代码,因此无法泄漏民众个资。目前超过20亿笔的实联制简讯,仅有约1,100万笔数据,因为疫调之需而被解译出来使用,其他都已经永久删除。
PETs技术就像一个工具箱,罗列多种先进技术,以解决使用在不同领域的数据保护,以差分隐私(Differential Privacy)技术为例,数据透过差分处理,将数据内容拆分不同部分,可避免数据集透过逆向工程的技术而还原,或是利用统计特徵反推单一纪录的原始内容,这些特性都将做到个资隐私的保护。
唐凤在入阁前,曾经协助国际大厂进行语音助理在地化的工作。当时针对不泄露语音样本内容的争议,就是利用差分隐私的技术,撷取许多样本中的零星特徵数据进行学习,因此无虞数据会被还原而被识别。
当数据规模够大时,还可收敛到呈现当地的口音特色,做为机器学习的重要数据集,进而提升或调教语音助理的识别能力,不用担心真人语音被泄露出去。
国研院国网中心为PETs技术提供开放式创新的发展环境
上述这些,无论是安全多方计算、差分隐私或同态加密(Homomorphic Encryption;HE)等新兴的PETs技术,都需要大量的高效能运算资源,唐凤期待具备国家超级电脑与基础设施的国研院国网中心,除了汇聚运算资源以支持产、学、研机构的PETs技术之外,还希望透过科普,介绍给大众了解隐私保护技术的重要性,对于隐私权的保护能够起教育民众的效果。
国网中心提供一个可预测、高信赖且费用合理的高速运算服务,其扮演国内研究PETs技术的主要启动者角色,可协助降低新科技发展前期的高额研发成本,一旦科技普及后,就可成为开放式创新的方式提供使用与验证,让产业界与其他科研单位共同分享成果,无形中PETs技术成果得以全民共享,也促成科技民主化的进程,每一个人都可以将成果用在符合公众利益的应用上,并从中受益。
未来当PETs技术普及后,重要的个人隐私与个资可以用来发展智能应用,成为增进国家治理能力的得力帮手,例如从针对个人的精准医疗,进而到一般健康民众的精准健康、智能照护的应用,协助台湾朝数码国家的方向迈进。