tttttt2222.png 400-678-4500


华为阐述下一代数据中心四点关键核心要素

栏目:行业聚焦 发布时间:2022-07-25

机房随着数字化转型进程的推进,各行业龙头企业,将加速应用5G、AI、云等数字技术,推动数据总量呈爆发式增长,对数据计算、传输和应用需求也将大幅度提升。作为支撑各行业数字化转型基础设施底座的数据中心,必将迎来新一轮增长。

图片

  “十四五”规划和2035目标纲要提出,加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群。今年2月国家发展改革委等部门正式发布通知,同意在京津冀、长三角、成渝、内蒙古等8地启动建设国家算力枢纽节点,并规划10个国家数据中心集群。“东数西算”工程正式启动,这为数据中心带来新机遇。
  
  那么,究竟什么样的数据中心才能迎接来自未来的挑战?2022年5月26日,华为在东莞松山湖面向全球发布了下一代数据中心理念和满足下一代数据中心需求的重磅武器——全新供电解决方案电力模块3.0。

  





未来数据中心的四个关键特征


  未来的数据中心可以被看作是一个智能生命体。人工智能技术建模,实时监测,通过智能模型时刻关注可用空间、电力与网络,保证资源得到最合理利用。基于此,华为携同全球数据中心行业领袖和技术专家展开广泛深入研讨,提炼出下一代数据中心应具备的四大特征:低碳共生、融合极简、自动驾驶、安全可靠。
  
  1.低碳共生:下一代数据中心将是全绿色、全高效、全回收的数据中心。面对高能耗、高资源消耗的挑战,通过资源源头(电力输入、水、土地、气候)的绿色化,实现数据中心与自然的和谐共生。大规模使用绿电,就近消纳本地光电、风电、水电等绿色电力,减少火电使用,“解绑”石化能源依赖。同时,在数据中心园区部署分布式光伏,充分利用园区屋顶及土地资源,可降低数据中心碳排放1%-2%。通过使用回收水及替代方式,减少清洁水的消耗。集约化利用土地资源,增加每平方米土地算力产出。通过选址或者技术手段,更大程度使用自然冷源。通过热回收技术,利用数据中心运行过程中产生的热量。通过推广新型装配式绿色建筑,采用绿色建筑材料,材料回收率力争超过80%。采用无铅无卤的绿色可回收新材料,提高材料回收利用率,促进数据中心低碳循环可持续发展。
  
  2.融合极简:为应对传统数据中心建设慢、运维难等问题,在数据中心不断升级发展的道路上,对“简单”的持续追求将驱动部件、设备、系统和数据中心架构的融合极简(数据中心建筑和机房形态、供电系统、温控系统)。采用预制模块化建设模式,将数据中心化整为零,改变建筑形态,从传统的“钢筋混凝土+现场施工”转变成“装配式钢结构建筑+工厂预制”。通过全模块化架构设计,改变机房形态,集成机柜、温控、供电、监控、消防等子系统,缩短交付周期缩短,降低运维难度,提升能效水平。将数据中心建设从串行走向并行,实现快速交付,按需部署,满足云数据中心时代的业务快速上线诉求。在不改变供电链路的情况下,对大型数据中心的供电系统的部件进行技术创新和融合,优化系统空间布局。利用拓扑池化、器件优化等技术,提升UPS模块功率密度,从而有效减少占地面积。在供电链路上进行创新,从全链路全方位进行设计,使其达到最简,降低链路复杂度。将温控系统多部件融合成一个模块,实现“一模块一系统”,简化冷链,有效缩短安装交付周期和运维难度。直接利用自然冷源为数据中心降温,从多次热交换变成一次热交换,缩短制冷链路,从而提升制冷效率。未来,对于机柜功率20kW以上的场景,以液冷为主、风冷为辅,风液结合的制冷方式将成为主流。
  
  3.自动驾驶:“运维自动、能效自优、运营自治”重构数据中心运营和运维管理模式。通过运维自动,5分钟完成2000机柜巡检;通过能效自优,1分钟内从140万个算法组合中推断出最佳冷却策略,实现从制冷到“智”冷;通过运营自治,最大化挖掘资源价值。基于AI的iCooling数据中心能效优化解决方案,可在给定的气候、业务等条件下,通过深度神经网络训练得出PUE预测模型。根据实时的气象条件、IT负载等参数推理,iCooling不仅能在1分钟内,从17万种组合中找出在当前室外环境、IT负载下的最优参数组合,并能根据业务要求进行多层过滤,最后得出最合适的指令,下发执行并反馈效果,实现数据中心能效最优。
  
  4.安全可靠:“主动安全、架构安全”保障数据中心的高质量、可持续发展。通过AI预测性维护,实现从“治病”到“治未病”。通过系统自动化故障响应,实现“1分钟发现,3分钟分析,5分钟业务恢复”,故障快速闭环;部件支持热插拔,整个设备采用冗余设计,单点发生故障的时候,0毫秒切换至冗余模块,大大增加了稳定性。从器件到DC,三重防护构筑安全防线,系统可用性达到99.999%。
  
  下一代数据中心在以上四个方面将会产生出许多突破性的技术、产品与解决方案,这些技术、产品和解决方案将引领整个数据中心行业走向绿色、安全、智能、高效。

  




满足未来需求的供电系统


  未来,数据中心将呈现高密化、规模化发展态势。供电系统作为数据中心的“心脏”,如继续采用传统方式,占地面积将会挤占IT系统空间,二者比值接近1:1。同样,链路的增加也产生了更多的消耗和损耗。而且,交付现场的情况也变得更加复杂:现场人工作业时间延长、安全隐患突出、运维成本的居高不下。通过不断摸索、实践与改进,华为研发出了满足下一代数据中心需求的重磅武器——电力模块3.0。通过核心技术的创新和部件融合,优化布局,打造更为省地、省电、省时、省心的数据中心供电系统。
  
  1.省地:占地面积节省40%。通过采用创新的融合架构和业界超高密的UPS5000-H,提高单柜功率密度,优化供电系统的空间布局,22柜变11柜,大幅节省占地面积。以12MW的数据中心为例,与传统攒机供电方案相比,采用电力模块3.0方案所节省的占地面积,可多部署170多个机柜。大量新的底层技术和扑翼式复合隔离开关,把原本横向的空间变成了纵向空间,内部元器件也进行了重新开发。在UPS功能模块中,整流模块和充放电模块融合成一个电路,整个切换模式变得更加安全可靠。在满足两个电路工作的情况下,将整个占地面积降低到50%,可以在600K机柜的固定空间里,兼容三个负荷隔离开关。
  
  2.省电:电能损耗降低70%。传统供电方案链路效率通常不高于94.5%,而电力模块3.0缩短了链路,全链路效率达97.8%。UPS5000-H智能在线模式效率高达99.1%,可有效降低电能损耗。以12MW数据中心为例,电力模块3.0可以将整体效率提升3.3%,相当于损耗降低70%、PUE值降低0.03,这就意味着每年可以节省电费200万元。
  
  3.省时:交付时间缩短75%。电力模块3.0内部连接采用预制廊桥式母排,且在工厂完成预制和调测,交付周期从2月缩短至2周。
  
  4.省心:SLA故障降低38%。基于“自动驾驶”的理念,结合AI技术,电力模块3.0配置了iPower智能特性,具备全链可视,以及AI温度预测、关键部件寿命预测、智能整定等双层可靠设计,实现运维从“被动响应”到“自动自预”的转变。在硬件配置上实现了独立的热备份单元和滤波单元。在市电的工作模式下,在硬件上增加一个独立滤波单元,同时逆变部分处于7×24小时的热备份状态。当市电出现异常,可以做到0毫秒切换。此时,整个热备份的功率降到最低,却依然可以维持99.1%的效率。当前数据中心,供应链系统都是独立的孤岛,给运维带来了极大困难,也带来了极大的安全隐患。尤其是供配电系统出现故障后,结果经常是灾难性的。华为利用AI技术,通过大量传感器和中央控制器,打造全程可视、预测性维护的双重安全运维模式,故障率下降38%。

  




基于实践创造未来


  长期服务数据中心行业需要企业拥有长技术链,同时对产品集成的能力要求也高。多年来,华为一直投入创新,以产品和解决方案渗透不同行业,积累了丰厚的实践经验,也使之对行业有了深刻理解。
  
  多年来,华为一直坚持源头绿色化,以尽可能地使用绿色能源。同时,华为还在思考,如何充分利用自然冷源进行制冷,降低对能动系统的依赖。从算力的角度,华为选择充分挖掘每一平方米土地的价值,使之承载更多算力。目前,华为已经将评价数据中心绿色的标准从PUE转向集PUE、WUE、CUE、SUE等在内的综合评价体系,全生命周期考量能源供应、利用与回收,并从技术可行性与经济效益两个维度持续探索,希望可以通过技术手段实现余热回收再利用。
  
  而实际上,数据中心一直都存在技术超前的问题。一个数据中心需要承担10年以上的生命周期,但是服务器一般3年就需要更换。因此就需要在数据中心设计之初规划好未来3-5代的服务器装载需求,才能做到向下一代兼容。同时,技术的不断发展,数据中心在未来还会遇到很多不可知的挑战,因此需要一个灵活和富于弹性的架构。电力模块3.0就采用了全模块化设计,可以按照1.6兆瓦、2兆瓦、2.5兆瓦灵活扩容。这就是华为在面对不确定的需求和挑战时,依然可以从容应对的底气。也正因为如此,“东数西算”所带来的机遇也会被华为紧紧抓住。
  
  华为高级副总裁、华为数据中心能源军团CEO杨友桂认为,“东数西算”是对未来数据中心的一个整体的规划和引导,将中国东部发达地区的算力需求与西部地区在绿色能源和土地方面的优势资源实现有机结合。随着“东数西算”工程的正式启动,数据中心集约化发展,需要进一步解放运维人力,因此华为选择通过人工智能技术和架构来支撑数据中心的智能运维与自动驾驶。
  
  而提到智能运维,就不得不提下一代数据中心构想中频繁被提及的AI。对此,华为数字能源首席营销官方良周表示,传统数据中心的检测是由人工定期巡检的方式来进行的,一个2000机柜的日常巡检人工大约需要2小时,当AI技术应用到数据中心日常检测中,5分钟就可以巡检完毕。AI技术大大地提升了运维效率。不仅如此,AI技术应用到能效提升方面也同样出色。一个4000机柜的数据中心,在采用AI提升能效之前PUE值是1.42,经过两次大规模数据输入和AI优化,PUE值降到了1.25。这意味着,对于一个4000机柜的数据中心来说,每年节电可达3000万度,折合成电费约为2000万元。而一个大型的数据中心长期运行后,制冷容量和供电容量的实际使用率可能只有60%,通过AI技术可以使其使用率提升到80%左右。然而,AI技术最杰出的优势体现在安全上。以往数据中心的维护主要是被动响应告警,事后处理;现在则可以通过AI算法实现主动预防,数据中心的安全性得到大幅提升。
 

       技术创新是引领数据中心行业发展和变革的关键力量。面向未来,华为将通过持续的创新投入,不断突破,与行业客户、生态伙伴、产业组织、标准组织开展全方位合作,共同迈向数据中心发展新时代。正如杨友桂在发布会上所阐述的那样:当所有人在预测未来的时候,华为在创造未来。