数据中心的“金属积木”是如何做出来的

北京2020年12月9日 12月8日-10日,第十五届中国IDC产业年度大典(IDCC2020)在北京国家会议中心盛大开幕。大会以“重新定义IDC”为主题,数千名数据中心从业者参与本次大会,共同探讨数据中心变革带来的机遇与挑战。其中,整机柜,这一被誉为数据中心的巨型服务器吸引了无数的关注与讨论。

经济学家熊彼特认为企业的创新能力与规模成正比,因为大型企业会有更多的资金和人力资源去投入。2011年,大型互联网企业Facebook发起OCP项目,开源了数据中心一系列硬件标准,其中整机柜是最重要的一个项目。就在同期,2011年的11月1日,BAT巨头们也不约而同牵头成立天蝎整机柜项目组,联合研发整机柜服务器,数据中心追求极致创新的产物即将诞生。

一个不确定的需求

2007年1月 ,第一代苹果手机Iphone2G上市,市场反应惨淡,以至于当年9月苹果宣布降价销售。直到2010年,iPhone4上市,苹果才真正打开全球市场。

也是在2010年,中国的公有云开始起步,阿里巴巴的王坚带领团队创建了阿里云,OpenStack社区在这一年也成立了,但是距离中国公有云的爆发还有2年,到2012年,百度云、青云、Ucloud等公司才创立。今天掌握整体服务器采购30%的超大规模云服务提供商CSP,当时还在考虑--我们需要什么样的服务器?

CSP的需求并不确定,服务器厂商也不清楚,这相当于一个婴儿刚刚生下来,就要给他做一套成年的衣服。但是,大的方向是清楚的。他们的一个原始理念就是追求的创新并不局限在单个节点,他会延伸到整个架构,甚至是数据中心的环境。当时Google等互联网公司部署了大量的定制化整机柜,可以在机柜内部署不同类型的服务器节点,一体化交付,让数据中心部署像”,效率提升10倍以上,并且在能效、TCO等方面优势明显。

国外都在做这样的产品,中国互联网市场上也有一些大客户提出“如果服务器年采购量达到十万台,按照单日交付300台来算的话,一年需要持续交付300多天,这样的效率显然无法匹配闪电爬升的互联网业务。”研发定制化整机柜的想法油然而生。

从一个idea到整机柜的出世

在2010年,互联网厂商刚一提出整机柜的想法,众多服务器厂商“跃跃欲试”,希望能研发出一款变革数据中心的服务器。但整机柜服务器的设计,只在国外最大的那几家互联网数据中心出现过,而由于数据中心保密政策,谁都不知道整机柜到底长什么样。

就这样大家只能不断试错,来来回回产品设计改了好几个月。整机柜这块“硬骨头”也确实难啃,没过多久,大多数服务器厂商在成本和心理的折磨下纷纷退出。当时只剩下一家还在咬牙坚持,就是浪潮。2010年底,第一款整机柜SR1.0诞生,机身高达2.1米,机柜内可容纳80个节点和3个交换机,能够大幅提升服务器部署密度和交付速度。

可在这时候,互联网厂商却由于实际运维难度太高,放弃了原有的采购计划。但被拒绝也不是什么坏事。在没有任何参照物的情况下,从无到有、摸着石头过河中产生的SR1.0,可以说是一个宝贵开始,它让市场看到了一个有形、有功能,真实存在的整机柜,而不再是停留在概念层的整机柜,也让同业人员看到了整机柜未来应用的潜能。

尽管SR1.0因为种种原因没能被应用,但可以看到,整机柜不光是单个互联网企业的需求,是整个互联网行业,甚至是整个数据中心用户共同的需求。作为探索市场的一块敲门砖,SR1.0为下一步浪潮整机柜服务器的快速研发打下了坚实的基础。

2011年浪潮整机柜SR2.0出现,使得越来越多的互联网公司开始关注整机柜。随后,2011年11月,在数据中心领域的科技企业汇聚在一起,构建了"天蝎计划",这是首个硬件领域的开放计算标准。半年后,在2012年4月,百度、阿里、腾讯、浪潮等发布了整机柜服务器的开放标准-天蝎整机柜1.0规范。

2012年4月,浪潮率先推出了符合标准的整机柜服务器SR3.0,为天蝎1.0贡献了大量的技术参考。SR3.0基于模块化设计理念,取消了单个风扇的形式,并将供电模块(PSU)集中到一起,通过12V直流铜排统一为所有节点供电。

2013年,整机柜SR4.0上市。SR4.0的机身宽度增加到21英寸,每个节点容量提升,风扇、电源和API管理各个模块有了统一的接口定义。从那时开始,数据中心的整机柜开始被大规模部署。

面对服务器功率、散热需求不断攀升的挑战,浪潮、百度、阿里等企业开始着手制定新一代的整机柜标准-天蝎3.0。在新规范中,单机柜的供电功率被大幅提升,支持20kw和36kw两种供电功率,部署密度较通用产品可提高30%-50%。同时,还增加了12V/48V高压供电,电力密度提升到80A-120A能力;散热方面,灵活支持风冷/液冷不同散热,并且整体架构可向前兼容支持,能够更灵活的应对云计算的物理高弹性的场景需求。

为满足整机柜服务器的大规模交付需求,浪潮建立了服务器高端装备智能生产基地,整合了智能技术和物联网技术,采用了ERP、MES、WMS等6大智能信息系统,将备料、节点、机柜生产、节点组装、班检、加电测试、业务压力测试等多个环节全链条打通。目前,智能工厂将整机柜的交付周期从15天缩短至5-7天。

为了避免在运输过程中整机柜发生形变,引起质量问题,浪潮采用物联网、移动互联等技术,开发了路谱测试方案。该方案可在整机柜的顶部、节点、托盘等位置上安装感应器,实时监测运输过程中的情况,并为整机柜产品陆运标准的制定提供第一手的实测数据。

持久的创新可改变自己。2010年云计算大爆发,2016年AI点燃新的科技变革,2019年5G牌照的发放更推动了边缘计算的发展。对于ICT企业而言,只有变化才是永恒不变的。对于传统企业而言,创新是制胜的手段;而对于ICT企业而言,创新是必然的生存之道。

从2010年到现在,数据中心领域的创新需要大规模的互联网企业和所有的行业合作伙伴的配合。整机柜的诞生同样需要百度、腾讯、阿里、中国移动、浪潮这样的领先科技企业的支持。浪潮信息副总裁、服务器产品线总经理沈荣表示,创新是为了能够符合客户需求、符合产业和技术发展趋势的开发出新的技术和新产品,但是,持久的创新则需要改变自己的态度,不断调整企业内部运营流程,建立新行业规范。