赛灵思发布U30加速器卡:系统功耗吊打NVIDIA T4

本周三,赛灵思推出了适应于视频转码的实时服务器一体机参考架构,同时发布了一款全新加速器卡alveo u30。
u30作为赛灵思alveo系列加速器卡的最新产品,注重实现高通道密度,这也是自赛灵思提出“数据中心优先”战略以来的又一次突破。
根据赛灵思的说法,采用赛灵思新型实时服务器参考架构,供应商们可以最大限度地降低成本,同时交付高品质的视频直播服务。这意味着,赛思灵的数据中心生态系统将进一步扩展和布局。
双管齐下,解决网络直播两大难题
2020年,在新冠疫情的倒逼下,视频直播迎来飞速增长。根据mhojhos research所提供的互联网行业报告显示,2020年全球实时视频流总市值达到310亿美元,预计到2026年达到940亿美元。
视频流市值一路攀升,也就意味着视频直播用户数量的激增以及对视频质量的要求更高,让本就占据大量网络流量的视频直播对带宽成本提出更高的要求。
根据“普拉多原则”,大约20%的视频流会吸引80%的受众,对于这20%的视频流,供应商需要在管理宽带成本的同时保持视频质量,对于剩下的80%,供应商则需要通过控制通道数量和提高通道密度来保持最低成本。
面对这两大难题,此次发布会上,基于实时服务器一体机参考架构和加速器卡alveo u30,赛灵思分别推出了两套解决方案。
1、基于u30,优化每通道成本
面对网络直播中“资源多观众少”的情况,赛灵思推出基于alveo u30 加速器卡的高通道密度视频转码一体机。该一体机还适用于安全城市、智能零售、电子竞技等应用场景。
赛灵思发布u30加速器卡:系统功耗吊打nvidia t4
此次推出的全新加速器卡u30采用的是半高半长的外形和单插槽的设计,同时支持h.264/avc和h.265/hevc两种编码格式,每卡能实时2x4kp60超高清转码,最多可支持48个通道。此外,u30支持低时延和超低时延的转码解码,能够在保证视频质量的情况下,将时延降低到100ms。在功耗方面,u30提供低于40w的低功耗设计方案,最高功耗限制为75w。
与同类竞品相比,高密度u30的解决方案有自己的优势,例如,其视频质量不亚于nvidia t4,且能够提供比t4更高的密度,在系统功耗上,不到t4的20%。
根据赛灵思的官方数据显示,若把赛灵思rt服务器同hpe proliant dl380 服务器相比较,一台搭载8个alveo u30 加速器的赛灵思 rt 服务器的性能相当于4台搭载32个nvidia t4 加速器的hpe proliant dl380 服务器,且前者的每卡吞吐量有4倍优势,硬件成本降低6倍,功耗成本降低5倍。此外,赛灵思表示,u30也可以加速英特尔的服务器。
赛灵思发布u30加速器卡:系统功耗吊打nvidia t4
2、基于u50,优化每比特成本
面对“资源少观众多”的情况,赛灵思则提出基于alveo u50 加速器卡的超低比特率视频转码一体机。该解决方案能够保证在每gb成本视频质量不变的前提下,降低比特率,减小重复性成本实现每流成本最小化,适用于对视频质量要求较高的场景。
u50加速器卡于去年8月份推出,是业界首款轻量级pcie gen4自适应计算加速卡,并面向所有服务器、各种云和边缘的数据中心应用,包括网络和存储加速。u50采用赛灵思 ultrascale+架构,率先使用半高半长的外形尺寸和低于75 瓦的低包络功耗。该卡支持高带宽存储器( hbm2 )和 100gbps 的网络连接,并支持第四代 pcie 和 ccix 互联标准。
根据赛灵思的说法,u50能支持1080p、120的hevc,如果用其他等效的软件基础设施要做到同样的性能,就需要5个hpe proliant dl380服务器再要加上10个非常昂贵的至强铂金级的器件才可以实现。但如果是使用u50的解决方案,就只需要1个hpe proliant dl385服务器再搭建8个alveo u50的加速器卡就可以实现了。因此,赛灵思解决方案每节点的吞吐量达到5倍的优势,硬件成本能降低6倍,功耗能降低3倍。
赛灵思发布u30加速器卡:系统功耗吊打nvidia t4
额外的软件解决方案,无需fpga开发经验
针对两种一体式服务器的解决方案,赛灵思也给出了较为简单便捷的3000ok软件解决方案。
在赛灵思的服务器优化软件解决方案堆栈中,因同amd的合作关系,主要使用amd的epyc处理器。最底部是赛灵思alveo u50或u30的加速器卡,加速器卡的上一层是赛灵思加速器二进制文件,该文件主要支持编码、解码和视频处理的功能。文件层的上方是赛灵思媒体加速api和运行时api,支持系统层、软件层等更高层次的应用。最上层则为ffmpeg命令行计算框架。
赛灵思发布u30加速器卡:系统功耗吊打nvidia t4
服务器的管理主要是在服务器内部来完成,使用的是资源管理或xrm技术,另外其他一些多服务器管理和多堆栈管理则是通过kubernettes管理功能实现的。这也就意味着,使用赛灵思的解决方案,只需要更改少量字符即可实现更加高效的视频转码,而无需fpga经验。
此外,由于赛灵思是同wowza进行合作,所以wowza的gui和视频直播引擎也被集成到赛灵思的实时服务器参考架构中。
赛灵思方面表示,之所以要在软件解决方案中提供额外的解决方案,就是希望能给客户提供非常全面的交付方案,以支持视频直播。
持续布局数据中心生态系统,开发增量市场
赛灵思在视频领域的布局时间长达十年之久,在视频直播领域长期同oem进行合作,在工业、医学、汽车等垂直领域也有多年经验,目前关注的重点是支持数据中心的工作负载,增强编码解码领域的算法。
在目前的实时视频转码一体机市场中,英特尔、英伟达、博通等企业占据着半壁江山,而赛灵思所占市场空间相对较小,之所以推出一体机,也是希望能够为客户提供可复制的经验,帮助客户更快实现部署。
相对与其他竞争对手而言,赛灵思提供的一体机的总拥有成本更低,这也就表明赛灵思希望通过更低的成本获得更多客户的青睐,从而建立更加完善的生态系统。
赛灵思大中华区数据中心高级销售总监钟屹表示,赛灵思始终聚焦在数据中心,特别是生态系统的持续扩展。在上个财年fy20赛灵思有给一万多个企业与学术单位做培训,有接近1000个合作伙伴加入alveo,并发布了超过130个基于alveo的应用。
小结
对于赛灵思而言,目前拥有fpga、有soc、异构的mpsoc和3dic,以及专门针对数据大爆炸和摩尔定律失效的acap。自2018年10月以来,推出多款适用于不同应用场景的alveo系列加速器卡,持续为数据中心注入新活力。