随着nlp预训练模型和迁移学习机制技术的突破,对于使用场景更加分散、场景本身更加复杂的nlp任务,百度推出了快速、高效实现开发需求的不同平台及技术解决方案,比如2019年首次提出的文心(ernie)。知道网
文心(ernie)是取得世界级突破的语义理解技术解决方案,基于百度的深度学习平台飞桨,文心将机器理解语言的水平提升到一个新的高度,为计算机带来了认知智能领域的巨大跨域。
文心(ernie)的核心技术优势在于,它开创性地将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化,如同人类持续学习一样。
这让它在16个中英文典型nlp任务上显著超越当时世界最好效果。
目前,文心已预置各类预训练模型,涵盖医疗、金融、法律等行业,并集成了轻量级模型和全系列nlp算法,满足不同企业开发者需求。
以金融行业为例,该领域各场景对nlp技术都有较强的依赖,尤其是金融文档的信息抽取、金融信贷的风控等方面。
度小满金融结合文心的预训练模型,对各种信息进行语义层面的深度建模,有效提升风控识别效果。
此外,在用户更容易感知的百度搜索中也有文心的身影,且大幅提升了搜索体验。
其实,不管是何领域,针对场景的快速部署都离不开一系列ai大生产平台,ai大生产平台打通了人工智能产业应用落地相关的全流程,实现了ai技术的标准化、自动化、模块化。
ai大生产平台可以避免企业开发者重复造轮子,有效降低开发者使用ai的门槛,实现低成本、快速应用。
吴甜提到,飞桨深度学习平台是ai大生产平台的重要基础底座,它能为ai应用生产提供核心框架、工具组件、服务平台等全方位的支撑。
针对企业强烈的应用需求,百度推出飞桨企业版。
企业版基于企业级需求,增强了相应的特性,包括提供更全面和强大的功能、更易用的可视化界面、预置更丰富的场景模型,以及更强化的安全权限管理等。
现阶段,飞桨已悄然应用到各类行业场景中,吴甜在分享中带来垃圾自动分类方案的实践案例。
目前,垃圾处理分类工作由机器和人协同完成,人工垃圾分类效率低、易分错,还存在想象不到的健康风险。
在飞桨的加持下,垃圾分类的许多问题已取得令人欣喜的进展。
基于飞桨平台,通过目标检测、图像分割、高效部署等过程,结合知识蒸馏算法与飞桨的分布式训练,以及智能云平台上的ai算力支持,垃圾分类解决方案集成在生产线后可以有效减少4到6个操作工人的人力成本,将分拣的效率从93%左右提升到了97%以上。
从2020年开始,疫情的突发给人们的生产和生活带来了巨大改变,人工智能的重要性也再一次引起社会各界的关注。
在这场疫情防控攻坚战中,人工智能凭借高效、精准的技术应用成为当之无愧的智慧担当。
在这场与时间赛跑的竞赛中,百度为合作伙伴技术赋能,6天推出基于百度ocr的社区疫情防控系统,迅速摸清社区居民的健康状况及流动情况;14天为中国疾控中心的和小程序上线疫情问答机器人,全天候解答关于疫情和复工复产等问题;3天实现北京地铁口罩人脸监测系统的快速部署,并在7天内进行两次模型升级
不难看出,深度学习技术已成为开发者的利器,为了让开发者能使用到更多、更好的预训练加迁移学习机制,飞桨不断增加预训练模型库等数据,对比2019年11月数据,目前飞桨的预训练模型库数量增长137%,模型的下载量增长了17%。
fune-tune的任务数量增长了124%。
与此同时,这个不断强大的开发利器也吸引了更多开发者使用,据吴甜透露,目前飞桨平台整体已经支持超过190万的开发者,服务了有超过8万家企业,基于飞桨平台产生了23万以上的模型,全面覆盖通信、电力、城市管理、民生、工业、农业、林业、工艺等众多行业。
为推进ai人才发展,百度开设了一系列相关课程,帮助开发者更快上手企业实际开发任务。
7月11日,上海市浦东新区人民政府也与百度签署了战略合作协议。
双方将强强联合,在三大方面重点探索ai在实体经济中的创新应用。
此外,由机器之心与百度联合组织的开发者日百度公开课还与来自不同领域的开发者围绕智能对话定制与服务平台unit、深度学习平台飞桨和零门槛ai开发平台easydl展开讨论,百度在本次世界人工智能大会更深层次的参与,能够进一步帮助开发者学习和掌握人工智能技术。
ai产业化、行业智能化,已经成为新一轮增长的突破口,以飞桨为代表的ai新基建成为抢占产业发展制高点的关键。
诚如世界人工智能大会开幕式上李彦宏所说,人工智能正处于从经济智能化的前半段向后半段过渡的时期,行业智能化正在成为突破口。
而在这场智能运动的背后,离不开具有集群效应、兼具效率与质量的ai技术平台。
百度将持续推进ai技术与产业应用的有机结合,推动行业智能化发展,赋能企业开发者,共享、共赢,完成划时代的智能化变革。