3月6日,在“ai in 5g——引领新时代论坛”上,人工智能产业发展联盟(aiia)正式发布“aiia dnn benchmark v0.5”首轮评估结果。该评估在aiia权威测试平台完成,基于端侧推断任务的深度神经网络处理器基准测试。在四大典型应用场景下,能够客观反映具有深度学习处理能力的处理器或加速器的性能水平。评估结果显示,海思麒麟980和瑞芯微rk3399表现上佳。
“aiia dnn benchmark v0.5”评估的标准较为严苛,包含四大典型场景和两大类评测指标等,指标包含速度(fps)和算法性能,如top1 、top5、map、miou、psnr等。同时,这也是深度学习处理器领域首次区分整型和浮点对比的benchmark。福州瑞芯微电子的rk3399开发板展现出抢眼数据。
采用28nm工艺的福州瑞芯微电子rk3399开发板,在评估中展现出超强性能。评估数据显示,在浮点模型不需要定点化重新训练的情况下,int8计算以精度损失大为1%的代价,达到相对于浮点计算两倍的性能。
此外,在interpretation评测中,aiia次尝试在基准测试中将量化和浮点模型分开评测。而福州瑞芯微电子rk3399开发板同样取得多项优异数据,在业内处于前列水平。
值得一提的是,福州瑞芯微电子rk3399开发板数据抢眼的背后,离不开前沿技术的支持。比如rk3399融入了tengine,后者是由open ai lab开发的一款轻量级模块化高性能神经网络推理引擎。tengine专门针对arm嵌入式设备优化,且无需依赖第三方库,可跨平台使用支持android、liunx等。
tengine支持各类常见卷积神经网络,包括squeezenet,mobilenet,alexnet,resnet等,支持层融合、8位量化等优化策略。通过调用针对不同cpu微构架优化的hcl库,能将arm cpu的性能充分挖掘出来。而rk3399的cortex-a72单线程运行移动端常用的mobilenet,一次只需要111ms。
在iot设备、智能交互设备、个人电脑、机器人等人工智能设备的创新与研发上,福州瑞芯微电子已经在技术上展现出领先优势,除了rk3399以外,旗舰级人工智能芯片rk3399pro同样极具看点,其首次采用cpu+gpu+npu的硬件结构设计。这一芯片集成的npu(神经网络处理器)融合了福州瑞芯微电子在机器视觉、语音处理、深度学习等方面的关键技术,片上npu运算性能高达3.0tops,具备高性能、低功耗、开发易等优势。
人工智能芯片大变革时代,人工智能产业发展联盟(aiia) “aiia dnn benchmark v0.5”权威测试平台的亮相以及首轮数据发布,或将终结ai芯片缺乏统一数据测试标准的局面,加速人工智能芯片的技术蜕变与进化。