芯片巨头齐聚旧金山传达一个信号:将AI放进芯片


7月18日,计算产业走到了转折点,一方面,深度学习(机器学习的一种)流行,对芯片提出新要求,另一方面,摩尔定律渐渐失效。几天前,来自各大芯片巨头的高管齐聚旧金山,讨论未来大计。
周二时,在applied materials赞助下,a.i. design forum(ai设计论坛)开幕;就在同一时间,另一场芯片年度盛会semicon west也拉开序幕。
从聚会传达的信号看,既有好消息,也有坏消息。先说好的一面,厂商开发许多新工具,例如,amd、xilinx开发的异构芯片可以满足深度学习的要求。再看不好的一面,计算需求越来越大,数据中心压力加大,到底厂商开发的新玩意能否减轻数据中心的压力呢?大家没有给出明确答案。
摩尔定律逐渐失效,芯片架构需要谋变
在semicon展会上我们看到许多新芯片,ai论坛的重点不是展示产品,而是讨论未来,比如机器学习大爆炸有何影响,对计算机来说意味着什么。
applied materials ceo gary dickerson发表演讲,他刚一开口就说摩尔定律正在减速,他还援引加州大学伯克利分校教授david patterson、alphabet董事长john hennessy提供的数据说,每年新处理的速度只提升3.5%。这一数据实际上有点过时了,2月份的新数据说提升速度只有3%。
dickerson预测,在未来大约10年的时间里,全球数据中心的ai负载将会占到计算周期(compute cycles)的80%,占据全球用电量的10%。
如何应对这种变化?dickerson认为行业应该从多个角度寻找解决方案,比如设计新芯片架构,开发新型内存芯片。他提到几种新内存,比如mram、reram(resistive ram)、pcram(phase-change ram)和feram。行业还要研究新逻辑芯片设计方法,开发新芯片,这种芯片可以用连续实值信号处理数据,而不是用离散单元的形式处理,除了硅之外,行业还要努力寻找新材料。
amd ceo lisa su和xilinx ceo victor peng都谈到了异构计算。
lisa su介绍了epyc服务器芯片,它将多块硅片封装在一起,在硅片之间有高速存储器总线。victor peng谈到了xilinx开发的可编程芯片,也就是fpga,它既能处理ai矩阵乘法,还能处理机器学习运行前后的传统软件任务。
因心存恐惧,谷歌tpu率先迈出一步
谷歌高级工程师cliff young介绍了tensor processing unit(简称tpu)的进展,从2013年开始,谷歌一直在开发tpu。cliff young解释说,谷歌之所以拼命开发tpu,主要是心存恐惧。
为什么这样讲呢?谷歌平台出现越来越多的机器学习服务,矩阵乘法已经成为谷歌数据中心计算周期中相当重要的部分,如果每个人每天向手机说2分钟的话,或者每天分析2分钟的视频片段,都用机器学习来完成,那么谷歌的计算机就会不够用。
cliff young告诉大家,ai服务需求出现大爆炸,既有可能带来成功,也有可能带来灾难,谷歌已经启动15个月的崩溃测试,希望能让性能提升10倍。
现在tpu已经发展到第三代,不过危机并没有结束。cliff young说计算需要正在飞速增长。谷歌有仓库一样大的建筑,里面装满架子,上面装有tpu,可是仍然不够用。如何扩大数据中心?即使是谷歌也受到限制,更别说其它企业了。
cliff young认为,硬件设计师、软件程序员应该携手合作,共同设计,还要与材料物理学家一起设计。cliff young问大家:“我们能不能用光收发器操纵神经网络呢?”光计算在矩阵乘法方面有着超强表现,但是用它处理神经网的其它关键部分表现却很平庸。
cmos是基本的芯片材料,cliff young认为行业应该努力寻找替代材料。内存计算同样很重要,我们可以让计算靠近内存单元,缩短数据传输距离。cliff young还说,机器学习也许能为模拟计算带来新机会。
摩尔定律已死,需要调整步调跟上ai速度
会议快要结束时,主持人与5位风投家座谈,谈论如何为尖端技术开发商(比如ai企业)提供资金支持。
5位风投家分别是lux capital管理合伙人shahin farshchi,spirit ventures普通合伙人laura oliphant,hardware club普通合伙人aymerik reynard,applied ventures普通合伙人rajesh swaminathan和英特尔风投投资主管jennifer ard。
座谈开始时,主持人问小组成员:摩尔定律是不是已经死了?有4人回答说“yes”,只有shahin farshchi给出否定回答。shahin farshchi解释说,虽然我们无法再用摩尔定律来预测晶体管的进步,但是计算力仍然可以用相同的速度增长,只是来自于整个计算生态系统。
不管这种说法准不准确,他的论调和会议的其它言论是一致的。整个行业正在调整步伐,希望能跟上ai的节奏。