了解IEEE联邦学习标准解决AI发展瓶颈,引领下一波机器学习技术商业化浪潮

近日,ieee p36521(联邦学习基础架构与应用)标准工作组第四次会议于北京成功召开。ieee、北京大学、中国电信、京东、、小米、阿里巴巴、华为终端、微众银行、vmware、logiocean、intel、cetc bigdata等22家头部企业与研究机构参与会议讨论。会议聚焦联邦学习的场景分类与需求分类,着重对联邦学习的安全测评与评级进行规划,进一步探讨联邦学习的标准制定。电话机器人在多线路进行群呼时,会筛选出意向客户,并快速将意向客户根据a、b、c、d、e类存储在系统里面;整个过程都有录音试听,可以清晰的进行聊天挖掘,为客户管理提供有效决策。
ai技术在实际应用落地的过程中面临着两大瓶颈:一方面,多数企业拥有的“小数据”难以聚沙成塔取长补短;另一方面,对数据隐私与安全的日益重视早已成为世界性趋势。而“联邦学习”作为加密的分布式机器学习范式,可以使得各方在不披露原始数据的情况下达到共建模型的目的,为应对ai落地困境提供了更多可能性。
作为全球最大的非营利性专业技术学会,ieee(电器和电子工程师协会)在学术及国际标准等领域具有公认权威性。2018年12月,ieee通过了《联邦学习基础架构与应用》国际标准(p36521),作为国际上首个针对人工智能协同技术框架订立标准的项目,该标准旨在对联邦学习的定义、框架、案例进行研讨分析,确立全行业规范。
人工智能时代,大数据是必备资源。然而,现在许多行业却仍面对着“小数据”而束手无策。多数企业拥有的“小数据”难以聚沙成塔取长补短。数据割裂、数据孤岛,成了限制人工智能(ai)发展的瓶颈。如何在促进合作发展的同时,避免数据与平台垄断和保护个人隐私,是人工智能产业化当下面临的一大难题。联邦学习(federated learning)作为新兴的加密分布式机器学习范式,其核心是让参与各方在不暴露原始数据的前提下联合建模,共同提升机器学习效果,实现ai协作。这一技术对于打破数据孤岛,进一步推动人工智能产业化意义重大。项目自去年12月成立至今,已经吸引了30余家互联网巨头、政府单位、企业和高校参与到标准制定工作中,覆盖金融、科技、医疗、教育等多个领域。
在前三次会议成果的基础上,本次工作组会议取得了以下进展:以更加细致的视角考虑了联邦学习在to b(企业端)、to c(用户端)以及to g(政府端)不同情境下的场景分类;建立起联邦学习的需求模板,并针对联邦学习的安全测评进行了详细的规划,极大程度丰富了联邦学习标准的内容,对联邦学习标准草案的出台具有重要的推动作用。
会议上,ieee联邦学习标准项目组制定了计划时间表:联邦学习标准草案预计将于2020年2月推出;正式标准预计将于2020年上半年出台。
联邦学习引领下一波机器学习技术商业化浪潮
人工智能不断进化的背后,也是机器学习的不断进化。那么,机器学习正在朝哪个方向发展?这种趋势又将如何影响整个人工智能产业?
人工智能落地面临的主要困境是数据问题。“小数据”和“数据孤岛”一定程度上阻碍了人工智能的商业化进程。针对小数据难题,工作组团队此前提出了“迁移学习”的理论体系,并将其应用于推荐系统等实际应用中,让机器具备了知识迁移、“举一反三”的学习能力。在第30届神经信息处理系统大会(nips 2016)上,著名人工智能专家吴恩达总结机器学习发展趋势时曾表示:“在监督学习之后,迁移学习将引领下一波机器学习技术商业化浪潮。”
随着数据隐私保护和数据安全形势日益严峻,gdpr等一系列严格的数据隐私保护法律法规相继出台。出于政策法规、商业竞争等因素,目前机构间的数据很难互通,“数据孤岛”成为人工智能落地的更大阻碍之一。“迁移学习”或许能解决“小数据”问题,但如何实现行业内甚至跨行业的更大范围合作,对人工智能商业化来说更为重要。这不仅仅是技术问题,更成为了一个复杂的社会问题。
谷歌在2016年提出了针对手机终端的联邦学习;微众银行ai团队则从金融行业实践出发,关注跨机构跨组织的大数据合作场景,提出“联邦迁移学习”的解决方案,将迁移学习和联邦学习两者结合起来。根据联邦学习研讨会上介绍,联邦迁移学习让联邦学习更加通用化,可以在不同数据结构、不同机构间发挥作用。没有领域和算法限制,同时具有模型质量无损、保护隐私、确保数据安全的优势。
开源框架推动联邦学习落地应用
近来,对联邦学习的研究正不断涌现。谷歌tensorflow federated(tff)开源框架和微众银行federated ai technology enabler(fate)开源框架的推出更是加速了联邦学习从概念走向行业落地应用。
2019年3月,谷歌开源了tff。其可用于去中心化数据的机器学习及运算实验,为开发者提供分布式机器学习,以便在没有数据离开设备的情况下,在多种设备上进行训练共享。
而fate则是2019年2月由微众银行ai团队对外发布的自主研发开源项目,也是全球首个联邦学习开源框架。其提供了基于数据隐私保护的分布式安全计算框架,为机器学习、深度学习、迁移学习算法提供高性能的安全计算支持。安全计算包括同态加密、秘密共享、哈希散列等多种多方安全计算协议。同时,fate提供了一套友好的跨域交互信息管理方案,解决了联邦学习信息安全审计难的问题。
简单易用的开源工具平台能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的前提下,进行多方数据使用和联合建模。
走向未来的联邦学习技术
未来的联邦学习将走向何方?在谷歌研讨会上,总结了联邦学习的主要研究方向:让联邦学习更加高效和有效;拓展联邦学习边界,解决更多问题;探索联邦学习新的应用场景;增强联邦学习的健壮性和抵御攻击的能力;突破准确性和实用性目标,更加关注隐私、安全和公平。
6月17日,国家新一代人工智能治理专业委员会发布《新一代人工智能治理原则——发展负责任的人工智能》,提出了人工智能治理的框架和行动指南。新发布的《治理原则》强调了和谐友好、公平公正、包容共享、尊重隐私、安全可控、共担责任、开放协作、敏捷治理等八条原则。原则出台为联邦学习的发展指定了方向,而相关政策对于隐私保护和开放协作的要求也为联邦学习的进一步发展提供了政策驱动力。
无论是从技术发展路径,还是政策法规大环境来看,可以预见的是:联邦学习将成为下一个推动人工智能取得商业化成绩的主要驱动技术。对于联邦学习的研究和落地探索不会停止。在科技之外,联邦学习涉及经济学、法律等多领域。在公平有效的激励机制下,由多方共同参与、建立公平健康可持续的合作生态,从而真正实现“君子和而不同”的“联邦”初衷,让科技向善,普惠大众。
在数据安全与隐私保护备受关注的环境下,联邦学习这一新兴的人工智能技术,将成为下一代人工智能协作网络的基础,建立起机构与用户间的数据信任。而联邦学习国际标准的制定,则将进一步为其在各行业的落地应用提供标准化的体系依据。相信在未来,基于统一的技术标准,社会各界将共同建起联邦生态,让联邦学习发挥出更大的潜能。
日前,记者在ieee p36521(电气和电子工程师学会联邦学习基础架构与应用)标准工作组第四次会议上获悉,联邦学习标准草案预计将于2020年2月推出,正式标准预计将于2020年上半年出台。
目前,联邦学习这一新兴的ai技术已应用于金融、医疗、城市管理等多个领域。为了提供联邦学习落地应用的技术规范,为社会各界共建联邦生态提供合作依据,ieee联邦学习国际标准项目应运而生。这一项目由微众银行发起,于去年12月获批,是国际上首个针对人工智能协同技术框架订立标准的项目。
标准工作组主席、微众银行首席人工智能官杨强介绍,在数据安全与隐私保护备受关注的环境下,联邦学习技术这一新兴的人工智能技术,有望成为下一代人工智能协作网络的基础,建立起机构与用户间的数据信任,推动科技向善。而联邦学习国际标准的制定,则将进一步为其在各行业的落地应用提供标准化的体系。
“ieee联邦学习标准项目组将以更加细致的视角考虑联邦学习在to b(企业端)、to c(用户端)以及to g(政府端)不同情境下的场景分类,建立起联邦学习的需求模板,并针对联邦学习的安全测评进行了详细的规划,这将极大程度丰富联邦学习标准的内容,对联邦学习标准草案的出台具有重要的推动作用。”杨强表示。
杨强介绍,ieee联邦学习国际标准项目自去年12月成立至今,已经吸引了30余家科技巨头、政府单位、企业和高校参与到标准制定工作中,覆盖金融、科技、医疗、教育等多个领域。