行业焦点

阿里巴巴发布Arm服务器芯片倚天:5nm工艺、600亿晶体管


浏览量:466

从专用到通用,阿里造芯长征突破艰难一役。

在今日于杭州举行的云栖大会上,阿里巴巴旗下半导体公司平头哥重磅发布了公司自研的云芯片——倚天710。也就是说,备受期待的阿里巴巴自研服务器芯片终亮相。


据介绍,该芯片基于Arm最新的ARMv9架构设计,采用业界更先进的5nm工艺制造,单芯片容纳高达600亿晶体管。具体而言,倚天710内含128个CPU内核,主频更高达到3.2GHz,能同时兼顾性能和功耗;在内存和接口方面,倚天710集成了业界最领先的DDR5、PCIe5.0等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。


从SPECInt2017基础测试平台的测试数据可以看到,倚天710跑分达到440分,是性能最强的服务器芯片,超出业界标杆20%,能效比优于业界标杆50%,能有效帮助数据中心节能减排。


众所周知,过去多年来,全球公有云业务的快速发展,给相关供应商带来了机会,随之而来的数据中心建设也给厂商带来了巨大的成本压力。得益于架构本身高性能、低功耗和低成本的优势,Arm服务器芯片在过去几年深受云厂商喜爱,亚马逊旗下的AWS也通过自研的Graviton系列给客户提供提供了新选择,国内的华为也是当中的重要参与者。此外还有Ampere computing和飞腾等一系列第三方的Arm服务器芯片供应商。


这次阿里巴巴宣布入局这个领域,就是他们的一次重要里程碑。


全球首颗5纳米Arm服务器芯片

据了解,在倚天710以前,全球所有的Arm服务器芯片(甚至放大到所有服务器芯片)都是基于7nm以上工艺打造的,换而言之,阿里巴巴“倚天710”是全球首颗基于5nm工艺打造的Arm服务器芯片。


正如前文所说,这颗芯片采用了很多最领先的技术,当中包括ARMv9、DDR5、PCIe5.0等等,这些技术都是刚刚诞生不久,而平头哥团队则对此做了深度定制,同时也引入了许多自研技术。而在面向服务器芯片更大的应用场景——“云”的高并发、高性能和高能效需求,平头哥团队在“倚天710”上做了很多针对性的设计,将领先的芯片设计技术与云场景的独特需求相结合,最终实现了性能和能效比的突破。


据平头哥方面介绍,“倚天710”是一颗从前端架构设计到后端物理实现都是自研的芯片。在这过程中,不但要求他们需要克服工艺以及IP不成熟带来的困难,还要求他们针对云场景的独特要求做定制化设计,技术上保障性能、功耗的均衡。


首先,在前端设计方面;据平头哥介绍,为了解决核数众多条件下的带宽瓶颈,公司对芯片的片上互联作出特殊优化,并采用新的流控算法和降低系统反压,有效提升了系统效率和扩展性,使单核高性能有效地转化为整个系统的高性能。此外,通过新的系统地址到DRAM地址的转换机制,能让芯片拥有安全、非安全隔离、多NUMA、异常通道隔离等多种特性,同时DRAM读写效率大幅度提升。


来到后端物理实现方面,平头哥团队通过灵活调度多达30种不同EDA软件、深度定制时钟网络和定制IP技术对芯片进行设计。此外,公司还采用了先进的多芯片堆叠技术,成功确保了芯片性能、功耗的优化。


如上所述,性能、成本和功耗是云服务商及云上企业关注的核心,而这也正是倚天710针对性设计所聚焦解决的问题。事实上他们将领先的芯片设计技术与云场景的独特需求相结合,也最终实现了性能和能效比的突破。此外,倚天710与阿里巴巴的飞天操作系统协同,还能为云上客户提供高性价比的云服务。


相关资料显示,阿里巴巴早两年推出的含光800已规模化部署于阿里云,基于这颗自研芯片的阿里云为云上企业提供了差异化选择,目前已应用于搜索推荐、视频直播等场景。而此次发布的倚天710也即将在阿里云数据中心部署,并逐步服务云上企业。


阿里云智能总裁、达摩院院长张建锋表示:“基于阿里云‘一云多芯’和‘做深基础’的商业策略,我们发布倚天710,希望满足客户多样性的计算需求,这款芯片不出售,主要是阿里云自用”。


“我们将继续与英特尔、英伟达、AMD、ARM等合作伙伴保持密切合作,为客户提供更多选择。”张建锋进一步强调。


据介绍,目前,阿里云已全面兼容x86、ARM、RISC-V等主流芯片架构,自研倚天710进一步丰富了阿里云的底层技术架构,并与飞天操作系统协同,为云上客户提供高性价比的云服务。


从专用到通用,阿里造芯长征突破艰难一役

对于成立于2018年的平头哥来说,倚天710并不是他们的芯片,如上文谈到的含光800,就是他们在2019年云栖大会扔出来的一个芯片“重磅炸弹”。


据当时的资料介绍,含光800是阿里巴巴颗自研芯片,也是全球性能最强的AI芯片,性能打破了当时的AI芯片记录,性能及能效比全球,在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比业界更好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。


而这次倚天710发布,对阿里巴巴有了更深层次的意义。因为这标志着平头哥完成了从专用到通用的转变,突破了阿里造芯长征中的艰难一役。通用处理器芯片是数据中心最复杂的芯片之一,其架构设计复杂,对性能、功耗要求极高,尤其是高端CPU研发,几乎是芯片设计天花板所在。长期以来,具备这一技术实力的企业寥寥可数,此前仅有Intel、AMD、AWS、华为等少数公司在此之列。阿里平头哥问世仅3年,凭着“生死看淡、不服就干”的劲头突破技术瓶颈,闯入梯队,实属不易。


能在芯片领域获得这样的成就,始于阿里巴巴团队从2016年开始的厚积薄发。


2016年11月,阿里投资软件定义网络(SDN)芯片公司Barefoot。该公司主要设计和生产可编程网络交换机芯片、系统和软件,曾开发出世界上个SDN芯片。此后,阿里巴巴又投资了翱捷科技、寒武纪、深鉴、耐能(Kneron)、中天微、恒玄科技等多家芯片公司,覆盖AI芯片、物联网芯片等领域。


2017年,阿里成立达摩院,其投身芯片研发的雄心日渐显露。成立后不久,达摩院也迅速组建了一支由半导体行业工业界和学术界专家组成的技术团队,研究方向全面涵盖系统架构、计算技术、存储技术以及芯片工程等核心芯片设计技术。


2018年,阿里巴巴全资收购大陆拥有自主嵌入式CPU IP core的中天微。按照阿里巴巴当时的说法,此次收购“基于阿里对芯片领域的长期关注和自身业务需求”,希望借此在物联网、人工智能等芯片竞争“新赛道”上提升中国芯片的竞争力。也就是在这一年,达摩院芯片研发团队与中天微团队合并成立平头哥半导体公司,后者一跃成为全球为数不多同时拥有处理器IP及芯片设计能力的半导体公司。


得益于深厚的技术储备,平头哥成立短短几年内,屡创佳绩。


在处理器IP方面,平头哥核心团队拥有十年以上的CPU IP和芯片研发经验,长期从事自研指令集架构、CPU微体系结构与系统芯片产品的研发,累计开发了十多款玄铁系列嵌入式CPU IP核,这些产品均已得到大规模量产的验证,累计出货量超过25亿颗;在云端芯片方面,背靠全球前三的云平台阿里云,平头哥能深刻理解数据中心业务场景和需求,因此能够更高效地研发业界的芯片,目前,平头哥已拥有含光800 AI推理芯片、倚天710通用芯片,这两颗芯片均实现了性能的突破。


虽然已经推出多款业界领先的芯片类产品,但阿里巴巴强调,公司未来会继续坚持投入芯片的研发。因为在他们看来,芯片是计算系统的核心,也是所有互联网应用、创新科技的基础。阿里巴巴集团横跨电商、物流、云计算、大数据、全球化等场景,拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,需要使用大量芯片,自研芯片能够降低阿里巴巴集团内部整体计算的成本。


与此同时,阿里云稳居全球云计算厂商前三、亚太的位置,倚天710、含光800等自研芯片还可通过阿里云输出给全社会,以更高的性能和更低的成本赋能更多的企业,让企业随时随地可以享受到算力。


写在最后

过去几年,在终端需求多样化、差异化竞争以及人工智能兴起等多个因素影响下,数据中心在渐渐发生变化。传统的服务器芯片也逐渐不能完全满足“云”的需求,进而兴起了芯片定制化的需求。而承载了Arm架构多种优势的Arm服务器芯片以及在特定领域拥有高性价比的AI芯片就成为了厂商追逐的目标,“倚天710”和“含光800”正是面对这些需求而生的。


对于阿里巴巴而言,这些芯片和后续的产品将完善公司做深基础的战略,也给公司云服务的未来带来巨大的想象空间。


此外,过去两年频发的地缘政治问题,把中国半导体的短板充分地暴露地在大家眼前。


根据知名统计公司ICinsights的报告,统计IDM和Fabless 2020年在集成电路市场的份额,美国公司以55%的市占率,紧随其后的是韩国公司(市场份额为21%)、中国台湾公司(7%)凭借其无晶圆厂公司IC销售额的优势,占IC总销售额的7%,比欧洲和日本公司(都是6%)高出1个百分点。来自中国大陆的公司则仅占全球IC市场的5%。具体到CPU这个领域,差距更是明显。


由此可见,于中国芯片产业而言,阿里平头哥“倚天710”的发布具有重要意义。寄望未来,相信这家极具潜力的科技巨头将在中国芯片产业未来的崛起中扮演关键的角色。


本文来自微信公众号“半导体行业观察”(ID:icbank),作者:李寿鹏,36氪经授权发布。