DIGITIMES Research观察,联合学习(Federated Learning;FL)技术兴起,以分散式运算架构,强调由用户参与AI模型训练且不需上传数据,可望解决数据隐私问题。随数据安全重要性攀升,Google提出FL技术,并应用于移動設備已有成效,NVIDIA及中国大陆业者亦竞相推出FL开发平臺,协助企业用户发展FL应用。 尽管FL应用发展仍须克服不少现实挑战,但由用户共同参与而提升AI模型品质,有望同时解决数据隐私及AI训练所需庞大数据的问题,以加快产业智能化进展。
近来数据隐私安全意识高涨,世界各国纷纷制定严格的隐私规范,使得企业在取得发展AI所需数据时更加困难。Google提出FL方法,采分散式(decentralized)架构设计,让用户不需将数据集中传送到特定服務器中进行模型训练,而利用本地数据在用户端进行AI模型训练后上传,与其他用户共享模型训练成果,其共享模型而不需共享数据、共同优化AI模型成果的特性,引起产业关注。
FL架构最早是由Google AI研究人员于2015年底提出,2018年个资法通用数据保护条例(General Data Protection Regulation;GDPR)施行后,促使科技大厂跟进发表能确保用户数据隐私的FL应用发展。Google将FL技术应用于移動設備上的字词预测App─Gboard,并与Facebook先后开源TensorFlow Federated (TFF)及PySyft FL框架,NVIDIA亦发表医疗及自驾车应用的FL开发资源,以协助企业加速导入能保护用户隐私的FL应用。中国近年积极订定数据隐私规范,使中国AI业者亦竞相推出能解决数据隐私疑虑的FL应用方案,后续落地情形待观察。不少新创业者也积极参与FL方案的开发,甚至成为大厂购并标的。
DIGITIMES Research认为,数据隐私重要性不断攀升而催生共享模型的FL技术发展,Google积极推动并大量应用于移動設備,而FL方案受限主从式(client-server model)架构、用户端数据型态差异大等因素,成企业发展FL应用需克服的挑战。但随FL分散式架构兴起,用户端装置将分担更多AI运算任务,可望加速AIoT发展,而透过用户参与共同优化AI模型,也将加速AI产业发展进程。