科大讯飞摘取Cityscapes评测桂冠,刷新世界记录

近日,科大讯飞在国际自动驾驶领域权威评测集cityscapes获得平均81.4%的精度,取得了该项评测的第一名,并刷新了世界记录。这也是今年科大讯飞继医学影像权威评测luna之后在计算机视觉领域获得的又一殊荣。
科大讯飞名列cityscapes榜首
cityscapes评测数据集在2015年由奔驰公司推动发布,是目前公认的自动驾驶领域内最具权威性和专业性的图像语义分割评测集之一,其关注真实场景下的城区道路环境理解,任务难度更高且更贴近于自动驾驶等热门需求。截至目前,cityscapes评测吸引了超过40支队伍参赛,包括google、香港中文大学等众多国内外优秀创新企业和顶尖学术机构。
cityscapes评测集如何判定结果?
cityscapes评测集包含50个城市不同情况下的街景,以及30类物体标注。此次科大讯飞参加的像素级场景图像语义分割评测,类别对象多、场景复杂,挑战难度大。cityscapes使用标准的pascalvociou(intersection-over-union)得分来评估预测结果与真实场景之间的匹配准确度,每个像素点的预测结果都会直接影响到最终得分。
左:真实场景中:场景标注右:讯飞算法预测结果
科大讯飞刷新世界纪录的法宝是?
此次评测,科大讯飞借鉴了已在教育图文阅卷中成功应用的复杂版面分析技术,并结合道路场景解析的特殊问题进行算法迁移,构建了一套具有丰富上下文信息的多层次图像语义分割方案。
根据道路场景下不同对象间的空间关联性,科大讯飞设计出多层次模型预测框架,将多类别“难例预测”简化并分治,同时借鉴多尺度混合感受野的模型设计,加入基于预测对象尺寸自适应调整权重的过程,对上下文信息和物体结构性信息进行更有效地利用。
像素级场景图像语义分割有什么重要意义?
提供参考
像素级场景图像语义分割被喻为自动驾驶中目标识别模块最精确和难度最大的算法,分割的结果可以为行车电脑以及驾驶员提供更加丰富和全面的路况参考信息,从而更加人性化的进行提醒或控制,这也是广大伙伴对于我们在车用机器视觉方面的期待。同时,分割的结果也可以为合作伙伴后续高级别自动驾驶中的路径规划任务积累经验和数据。
简化流程
相比于行人检测、物体识别等算法需要系统再次推导空间路径,图像语义分割算法的输出使得整体决策流程更加简化,缩短判决时间的同时又不失安全性。
减少失误
高精度图像语义分割技术为驾驶控制提供更准确的决策参考,其算法效果上每一次细微的改进,都可能意味着真实环境中判决失误次数的极大减少,由此导致的事故率也随之降低,这正是我们不断追求算法提升的价值所在。
科大讯飞在计算机视觉领域发展如何?
科大讯飞在人工智能领域全面发展,在基于深度学习的通用核心技术上有着深厚积累。不仅在智能语音、机器翻译等相关的多项国际权威赛事取得第一,实际上,科大讯飞在教育图文、人脸识别等计算机视觉领域也深耕多年,拥有丰富的经验和国际领先的技术,并已运用在教育、医疗、金融等多个行业。
今年8月,科大讯飞在国际医学影像领域的权威评测luna中以显著优势获得第一、刷新世界纪录,证明在计算机视觉与医学影像结合的重要领域已走到世界前列;此次cityscapes再下一城,充分彰显科大讯飞在计算机视觉领域的技术水平,以及在人性化辅助驾驶方向的拓展能力,也为未来与行业应用的深度结合打下了坚实基础。