浙江安智信通信技术有限公司

华为服务器高品质的背后--技术实力篇

发表时间:2021-04-20 12:01

战略投入是一个长期、痛苦的积累过程,在研发上,过去 10 年,华为累计投入 2400 亿元进行研发创新,17 万员工中研发人员占比高达 45%。华为在全球设立 16 个研发中心,36 个联合创新中心。如此高投入的背后,很多人并不知道,华为也曾经历了常人难以想象的艰难。

具体到服务器的研发方面,华为每年都将超过 10% 的收入用于研发,自始至终以高品质、高可靠性、技术领先、差异化的创新作为自身的价值定位,围绕客户应用场景,从底层芯片、整体架构、工程设计和上层应用全面持续创新,充分地满足客户当前和未来对于云计算基础设施的变化需求。此外,华为在底层芯片上也持续投入巨大,在管理软件、虚拟化、大数据、分布式存储、数据库、操作系统、算法等方面也累积了丰硕的实践。

稳定可靠是华为服务器的核心设计理念

稳定可靠这个词总被大家所提及,说到底是因为什么呢?还不是因为大家怕了,一旦系统出现故障,后果可想而知,对用户来说简直就是天大的噩耗。

说到业务的可靠性时,经常会提到所谓的 4 个 9 或者 5 个 9, 也就是 99.99% 与 99.999%。从数字上来看,4 个 9 与 5 个 9 的差距就是 0.009%,还不到 0.01%。但是对于系统而言,恰恰是这不到 0.01% 的差距,决定了系统完全不在一个档次上。

4 个 9 与 5 个 9 的可用性,在一年的时间维度上,相差了 47.3 分钟 ( 平均一个月相差 4 分钟,如果一家银行一年内有这么长时间不能提供服务,后果可想而知。虽然可用性决定于硬件与系统软件,但无可否认,硬件平台的可靠性将为高可用性提供重要的保障。

华为在面对用户对于可靠性的诉求时,从元件筛选、硬件设计流程、设计创新,以及最后的品质检测,无不体现出华为对服务器的高可靠性的追求。

热稳定、冗余设计、降额设计、环境防护是华为服务器的匠心设计

热稳定主要做了散热优化,华为采用了多项先进散热技术,包括双面蜂窝孔板技术 -- 实现开孔率 43%,同比友商提升 15%,提升系统进风量;系统矢量气流精细化管理——冷却气流得到高效利用,解决 105W、130W、155W 全系列 CPU 的散热需求;铝基板镶铜散热器技术——比常规散热器重量减轻 45%,热阻减少,散热效率更高。最值得一提的是,华为采用了 PID ( proportional-integral-derivative: 积分 / 微分 / 比例 ) 精细化调速,调速精度在 1 度以内,响应速度业界领先,保证散热同时时整机能耗最优耗。

冗余设计上对易损部件如电源做了冗余备份,主要考虑的就是热插拔设计,华为服务器的电源模块、风扇模块、存储模块、等关键模块均采用冗余 & 热插拔设计,保证客户可靠稳定的运营环境。

降额是以高标准进行元器件认证与选型,并在实际使用时降额使用,确保元器件在使用过程中的高可靠性。要求器件都满足降额的设计方式,这使得器件在工作中所承受的使器件工作中所承受的应力 ( 主要是电应力和温度应力 ) 低于额定值,以达到降低故障率,提升使用可靠性的目的。

在环境防护上除了做了一定程度的防腐蚀设计外,还从多个层次做了抗振设计,比如在服务器的风扇部分增加了减震螺杆,弱化振动源头;在机箱与硬盘框结构上分解共振点,阻断振动传播路径;在硬盘托架增加高弹性金属弹片,保护硬盘本身。经过这些独居匠心的工艺设计,才使得服务器具备非常出色的抗震能力,在陆地运输、轻微地震、车载舰载等特殊场景下也能保持一定的高可靠性。

综上所述,可以看出一台高可靠的服务器其实需要不同阶段的全方位努力才有可能做到,就这一点来说。设计出一台高可靠服务器,是困难的,它需要对元器件有着很好的品质管理,对于产品设计有很好的自我纠错的能力与流程,而在具体的产品设计中还要有自己的创新,以进一步有别于友商,最后要给自己制定更为严格的出厂检测标准。这相当于在一种近似于 " 自虐 " 的环境中,向客户交付出高质量高可靠的产品。


首页               公司简介            华为产品            服务支持            新闻中心           联系我们
24小时服务热线
400-668-1667