4月26日,网易有道在全球移动互联网大会(gmic)上发布了最新的实景ar翻译技术,这是国内首个真正的实景ar翻译解决方案,给当前打得火热的翻译界又添了一把火。
有道实景ar翻译的整个过程完全是动态的,和出国旅行、购物等场景十分契合,并且接入了有道的离线神经网络翻译技术(ynmt),翻译质量堪比专业八级,速度极快。这比起以往的拍照翻译,体验上有了跨越式升级。
完全离线,所见即所译
翻译工具最高频的使用场景就是国外旅行、海淘购物,而输入文字再翻译的效率并不高。有道实景ar翻译就能解决这一问题,只需要拿起手机扫一下,就能获取商品信息、路标提示,整个翻译过程,比扫二维码还要快。最重要的是,整个过程全部离线完成,即使在没有网络的情况下,也不会有语言障碍。据了解,目前有道实景ar翻译已经支持中英日韩四种语言。
有道实景ar翻译能够实现手机镜头在运动状态下对被摄内容的跟随翻译,跟随速度非常快,能精准地呈现出翻译结果。针对一些常见的翻译语料,比如论文、化妆品包装、个人证件、产品说明书,有道实景ar翻译都做了专门的技术优化。而在翻译结果的视觉呈现上,翻译结果的边缘、背景色与字色均可与原背景无缝贴合。
跨越技术门槛,集合顶尖ai科技
全离线的实景ar翻译技术门槛很高。有道从2016年开始尝试,经过几次技术的实验、推翻、再实验,才有了目前的成果。在gmic大会上,网易有道首席科学家段亦涛,剖析了其中融合的4项ai黑科技。
动态跟踪 (tracking)
不同于静态的拍照翻译,实景ar翻译,是在动态移动的情况下完成。有道自主研发的动态跟踪,就是用运动预测模型去实现动态跟踪,速度能达到90帧/秒。“电影画面的跟踪速度是24帧/秒,所以有道的tracking速度看起来是非常流畅的。”
ocr组段分析(layout analysis)
让机器理解人类语言的段落层次,是影响翻译结果很重要的因素。为此,有道用了ocr组段技术训练了上百万份不同类型的语料。段亦涛表示,“组段技术在实景ar翻译中非常重要,这也是为什么用户会感觉到有道的实景ar翻译会比谷歌更通顺。”
离线神经网络翻译(ynmt)
离线ynmt极大的提升了实景ar翻译的速度。安装不到100m大小的离线包,就可以在无网络的环境下轻松翻译。有道的ynmt是翻译领域的最尖端的技术之一,中英翻译质量媲美专业八级。
ar渲染技术
后台翻译完成后,有道自主研发的ar引擎会在20毫秒内完成像素级渲染。翻译结果的背景边缘、颜色以及字体颜色均保持与被摄原图高度融合。
翻译领域的技术革新者
ai爆发之后,有道几乎每年都给翻译界带来颠覆性的技术革新。
2017年4月有道推出基于神经网络翻译的技术(ynmt),突破了过去统计翻译模型(smt)的局限,翻译质量的提升是过去十年的总和。
很快,有道上线了离线的ynmt,配合离线ocr技术,突破了网络环境对翻译的局限,翻译速度大幅提升,准确度堪比联网效果。
为了给用户更好的语音交互体验,有道首次尝试“ynmt+智能硬件”的翻译方案,推出了有道翻译蛋。而拍照翻译和此次推出的实景ar翻译,则是基于视觉交互的翻译解决方案,让翻译体验再升级。总尝试“第一个吃螃蟹”的有道,已经有了深厚的技术积累,成为中国翻译技术革新的推动者。
来源:北京晨报网