中国第一次大规模ai开发者大会——百度ai开发者大会(baiducreate2017)圆满落幕,超过5000名开发者和行业伙伴齐聚一堂与百度一起见证ai开放时代。其中,ai技术与开放平台分论坛被参会嘉宾称为“最极客”的分论坛,不少开发者评价此次分论坛“全程无尿点”、“时间太短”。
那么,在这2个半小时里发生了什么?百度究竟发布了什么“神秘武器”?下面为大家快速盘点百度ai开发者大会ai技术与开放平台分论坛的重要内容,没去现场也能get最全干货。
百度ai技术平台架构首次详解
大会主论坛首次公布了百度整体ai架构及布局。作为百度ai的核心,百度大脑由算法层、感知层、认知层、平台层组成,其中算法层是机器学习平台,包括深度学习,作为百度大脑的底层基础。值得一提的是,在算法层之上,百度大脑是业界首个清晰划分出感知层和认知层的ai架构。
在会上,还宣布了开放14项全新能力,包括语音、视频、增强现实、机器人视觉、自然语言处理五大类,与已开放的能力一起,共同构成具有60项核心能力的完整的、综合的ai技术开放平台。据悉,百度ai开放平台在完整性、开放性、前瞻性和发展性方面均领跑业界。。
语音技术全面升级推出开放生态2.0
分论坛上,宣布远场识别及唤醒技术、定制化语音合成、极致语音合成音色、emotionalcui(ecui)等技术全新开放,并发布了百度语音开放生态2.0。在现场以视频实录的形式展示了远场识别技术,从距离3米到10米都可以准确识别测试者说的内容。首次提出的emotionalcui(ecui)是在cui基础上的升级,可以从对话者的音量、音域、语速、音色几个维度发掘更多信息,实现个性化声音、生动对话、情绪响应等功能,增强对话感,融入更多情感的对话体验。
发布理解与交互技术平台开发者可定制
此次发布的理解与交互技术平台unit,基于百度自然语言处理技术十多年的深厚积淀,可为开发者提供领先的语言理解与交互技术、从百度大数据中自动汲取最有价值的数据供开发者使用以及强大的定制化能力。并推出理解与交互“训练师”模式,自动完成边交互边训练,助力开发者训练对话机器人,赋予机器“理解”自然语言,听懂用户需求,以及与用户进行多轮次对话的能力。对开发者来说,降低了nlp技术的使用门槛,并节省了开发时间。开发者可登录unit.baidu.com下载使用。
视频分析技术实现“以图搜影”“视频互搜”
分论坛视频技术部分介绍了:视频分割、视频封面选摘、视频分类/标签、视频索引/检索、视频细粒度物体识别、视频审核色情识别、视频公众人物识别、视频结构化分析、视频细粒度识别等技术以及机器人视觉。
其中,视频分割是无人驾驶/机器人的核心技术,但对数据和精度要求很高,需要像素级别的输出信息,和更多的视频训练数据。在这一点上,百度已经拥有世界上第一个室外语义分割rgbd视频数据集,并将继续开放全新数据集。
此次推出的机器人视觉开放平台由摄像机imu模组、slam、障碍物检测、地图重建、和语义识别几大部分构成,并已开源开放。
发布全新dumixar开放平台将开放内测
dumixar开放平台由4部分组成,包括arsdk、内容制作工具、云端内容平台和内容分发服务。在今年1月份,百度宣布正式成立增强现实实验室(arlab),并在手机百度、百度地图、百度糯米等多款百度应用上线了如ar神奇动物园、ar课程知识点、ar复原老城门及兵马俑古建、ar步行导航等多个场景标杆案例。此次在ai开发者大会全新推出的dumixar开放平台,正式将百度强大的ar技术积累开放给开发者,可为开发者提供强大的图像识别与触发、鲁棒的三维感知与跟踪能力、丰富的智能交互、超轻量ar渲染引擎等能力支持。据悉该平台将开展三个月的内测,开发者不要错过。
paddlepaddle:全开放的项目组织模式、研发云
本次开发者大会paddlepaddle一次性宣布了全开放的项目组织模式、重构路线图、研发云、开放大规模数据和应用模型库等。
据悉,paddlepaddle开源将在9月初推出新版:更加灵活易用,发布paddlepaddle应用模型库。12月初将再次更新升级:支持volta16位浮点,支持tensorrt。全新推出paddlepaddle研发云,将采用kubernetes并行计算管理环境,对gpu,fpga,cpu,及众多深度学习计算硬件持开放态度,并鼓励最优深度学习硬件。
此外,现场还公布了已有13年历史的“百度之星”大赛,今年会在传统设计大赛的基础上增加开发者大赛,主题是设计和开发一个以对话式人机交互为核心的智能产品,为开发者提供一个展示自己ai创意和实现ai理想的平台。
相关新闻 2016-01-28 2016-07-02 2016-08-22 2017-08-12 2017-08-21