对数据中心中的冷却进行控制的方法

文档序号:884752 发布日期:2021-03-19 浏览:1次 >En<

阅读说明:本技术 对数据中心中的冷却进行控制的方法 (Method of controlling cooling in a data center ) 是由 温斯顿·加西亚-加滨 卡捷琳娜·米申科 于 2019-08-13 设计创作,主要内容包括:对数据中心中的服务器的冷却进行控制的方法,数据中心包括多个服务器机架,每个服务器机架包括多个服务器,冷却由过道冷却单元经由冷过道、以及由服务器风扇提供,其中方法包括:从数据中心中的温度传感器获得(Si)温度测量结果;基于温度测量结果、利用对冷过道温度和对过道冷却单元的气流水平的约束,执行过道冷却单元和服务器的总电力消耗的优化(S2);以及基于优化来控制(S3)过道冷却单元。(A method of controlling cooling of servers in a data center, the data center including a plurality of server racks, each server rack including a plurality of servers, the cooling being provided by aisle cooling units via cold aisles, and by server fans, wherein the method comprises: obtaining (Si) temperature measurements from temperature sensors in the data center; performing an optimization of the total power consumption of the aisle cooling units and the servers based on the temperature measurements with constraints on cold aisle temperatures and on air flow levels of the aisle cooling units (S2); and controlling (S3) the aisle cooling unit based on the optimization.)

对数据中心中的冷却进行控制的方法

技术领域

本公开大体上涉及在数据中心中的冷却控制。

背景技术

数据中心是用于安置服务器的设施。数据中心具有多排机架,其中每个机架包括多个服务器。服务器产生大量的能量而导致安置服务器的房间升温。由于服务器的电子器件对于高温比较敏感,所以数据中心设有用于冷却服务器的冷却系统。冷却系统包括产生冷空气或冷液体的冷却单元和用于将冷空气/液体分配给包括服务器的机架的分配网络。冷空气通常经由容纳一排服务器机架的过道中的地板中的开口来供应。该过道被称为冷过道。冷空气从冷过道经由服务器机架流至在冷过道的服务器机架另一侧的下个过道。这下个过道被称为热过道。

对大型数据中心的冷却需要大量的电力。以工业级水平操作的大型数据中心可能使用与小型城镇一样多的电。几乎总电力的一半都被冷却系统消耗了,该冷却系统对于服务器的安全操作是不可缺少的。

在典型的数据中心中的冷过道的温度应维持在由数据中心的运营者的合同来限定的给定范围内。在操作期间,在冷过道中的期望温度通常是由运营者在观察由传感器网络在冷过道中测量的温度后手动设置的。因此,运营者的目的在于,根据IT负载的动态变化通过手动地改变由冷却设备供应至数据中心机房的冷却电力来避免在数据中心中的过热点和过度冷却。

数据中心中的电力消耗取决于多个类型的冷却设备以及服务器由于IT负载而产生的电力消耗。例如,诸如计算机机房空气处理器(CRAH)的过道冷却单元在他们必须产生更高的冷却功率时将消耗更多电力。这意味着以低温设置和高气流设置操作的冷却单元将消耗更多的电力。另外,服务器通常具有用于冷却服务器内部热源(例如中央处理器(CPU)或存储器)的小的服务器风扇。服务器风扇通常是很低效的。效率通常在25%左右。中型的数据中心具有数百个服务器机架,其中每个服务器机架具有数十个服务器,并且每个服务器具有多个服务器风扇。因此,服务器风扇中的电力损耗构成了数据中心的电力消耗的相当大的一部分。

美国专利申请US2017/187592A1公开了一种用于确定符合动态需求的冷却设定点的系统。为了减少整体冷却成本,该文献提出,确保跨多种冷却硬件的协调的优化是重要的。使用于单个冷却设备的能量最小化的途径可能造成能量耗费方面的整体提升。

发明内容

然而,在US2017/187592A1中公开的途径没有针对在执行高效冷却与最小化电力消耗之间的权衡提供最优的解决方案。具体地,根据US2017/187592A1,通过如下方式进行“优化”:首先确定冷却设定点,再使用冷却设定点来预测CPU温度并将预测的CPU温度和临界阈值进行比较。如果预测的温度高于临界温度,那么调整冷却设定点并重复该过程直至预测的温度低于临界温度。在这种情况下,确定了预测的CPU温度的准确性,并且最终将“最优的”设定点应用到冷却硬件。

基于上述情况,本公开的目的在于提供一种对数据中心中的冷却进行控制的方法,该方法解决或者至少缓解了现有技术中的问题。

因此,根据本发明的第一方法,提供了一种对数据中心中的服务器的冷却进行控制的方法,数据中心包括多个服务器机架,每个服务器机架包括多个服务器,冷却由过道冷却单元经由冷过道、以及由服务器风扇提供,其中方法包括:从数据中心中的温度传感器获得温度测量结果;基于温度测量结果、利用对冷过道温度和对过道冷却单元的气流水平的约束,执行过道冷却单元和服务器的总电力消耗的优化;以及基于优化来控制过道冷却单元。

数据中心的总电力消耗因此可以被降低,同时可以保持对服务器的充分冷却。从持续性观点来看,总电力消耗的降低是有利的。它还减少了冷却成本。另外,通过避免服务器过热,数据中心设备的使用寿命可以被延长,并且可能潜在地增长维护间隔。

对过道冷却单元的气流水平的约束是过道冷却单元被设计为在其中进行操作的气流的区间。

根据一个实施例,优化是仅包括两个目标的多目标优化,两个目标中的第一目标是过道冷却单元的电力消耗并且第二目标是服务器的电力消耗。

因此,在两个对立的特征(即过道冷却单元的最优电力消耗和服务器的最优电力消耗)之间可以实现平衡,从而使总体冷却电力消耗最小化。

一个实施例包括:在优化的步骤之前,单独地对第一目标和第二目标中的每个目标执行初始单目标优化,以获得第一目标和第二目标中的每个目标的最小值。

根据一个实施例,优化得到一组帕累托最优解,其中控制基于帕累托最优解中的一个帕累托最优解。

一个实施例包括:基于预定的选择规则从一组帕累托最优解中选择帕累托最优解。

根据一个实施例,选择规则是使用提供了过道冷却单元的最小电力消耗的那个帕累托最优解。

根据一个实施例,选择规则是使用提供了服务器的最小电力消耗的那个帕累托最优解。

根据一个实施例,对冷过道温度的约束是冷过道温度在最小允许合同温度与最大允许合同温度之间的范围。

根据一个实施例,对气流水平的约束是过道冷却单元风扇的风扇速度的范围,过道冷却单元被设计为在该风扇速度的范围中进行操作。

根据一个实施例,服务器的总电力消耗是服务器风扇的电力消耗和由IT负载所导致的电力消耗的总和。由于IT负载所导致的电力消耗是由操作中的服务器所消耗的电力。

优选地,由于IT负载所导致的电力消耗仅被用作进行优化时的干扰输入参数,并且不是控制变量。

根据一个实施例,过道冷却单元是计算机机房空气处理器CRAH单元。

根据本公开的第二方面,提供了一种计算机程序,该计算机程序包括计算机代码,当计算机代码被数据中心控制系统的处理电路系统执行时,使得数据中心控制系统执行根据第一方面的方法的步骤。

根据本公开的第三方面,提供了一种计算机程序产品,该计算机程序产品包括存储介质,存储介质包括根据第二方面的计算机程序。

根据本公开的第四方面,提供了一种用于对数据中心中的服务器的冷却进行控制的数据中心控制系统,数据中心包括多个服务器机架,每个服务器机架包括多个服务器,冷却由过道冷却单元经由冷过道、以及由服务器风扇提供,其中数据中心控制系统包括:存储介质,包括计算机代码;以及处理电路系统,当执行计算机代码时,处理电路系统使得数据中心控制系统执行根据第一方面的方法的步骤。

一般而言,用于权利要求中的所有术语应根据它们在所属技术领域的通常含义来进行解读,除非在此明确地另有限定。所有对“一/一个/所述元件、设备、组件、装置等等”的引用应以开放式被解读为引用“所述元件、设备、组件、装置等等的至少一个实例”,除非明确地另有说明。

附图说明

现在,将通过示例并参考附图来描述本发明的构思的具体实施例,其中:

图1示意性地示出了包括多排服务器机架和冷却设备的数据中心的示例的俯视图;以及

图2示出了对数据中心中的服务器的冷却进行控制的方法的流程图。

具体实施方式

现在,将在下文中参考附图来更完整地描述本发明的构思,在附图中示出了示例性实施例。但是,本发明的构思能以多种不同的方式来实施,并且不应构成对在此要求保护的实施例的限制;确切地说,通过示例来提供这些实施例,使得本公开变得详尽并完整,并且将完全地将发明的构思的范围传达给本领域技术人员。在说明书中从头至尾,相同的数字表示相同的元件。

图1示出了数据中心1的示例。数据中心1具有数据中心机房3。数据中心机房3可以包括设有孔的抬高的地板。数据中心机房3包括多排5a-5d的服务器机架7a-7d。每个服务器机架7a-7d包括多个服务器6。服务器机架7a-7d被布置在抬高的地板上。

数据中心1还包括被配置为冷却服务器6的冷却设备。在本示例中,冷却设备包括过道冷却单元9和服务器风扇11。过道冷却单元9例如可以是CRAH。CRAH具有两个可控参数,即冷却线圈的温度、以及CRAH风扇的速度、或将空气吹过冷却线圈的过道冷却单元风扇的速度。每个服务器风扇11被布置为冷却特定的服务器6。特别地,服务器风扇11可以被配置为冷却服务器的一个或多个发热电子部件(例如CPU)、一个或多个存储器或电源。可以设置多个服务器风扇11来冷却每个服务器6。

过道冷却单元9具有冷却出口,该冷却出口被布置为借助于过道冷却单元风扇在抬高的地板下方提供冷空气。在抬高的地板下方可以有气流分配系统,该气流分配系统被配置为将冷空气流从过道冷却单元风扇分配至冷过道,其中冷空气通过开孔的抬高的地板流动进入数据中心机房3的冷过道以冷却服务器机架5a-5d。有一排服务器机架7a-7d立置其中的每个其他过道通常都是冷过道,从而冷过道和热过道是交替布置的。在图1的示例中,排5a左侧的过道8a是冷过道,并且排5a右侧的过道8b是热过道。

数据中心控制系统13被配置为控制过道冷却单元9。数据中心控制系统13包括存储介质13a和处理电路系统13b,该存储介质包括计算机代码。数据中心控制系统13还可以包括多个控制器。处理电路系统13b可以被配置为将设定点值提供给控制过道冷却单元9的控制器,从而控制对服务器机架7a-7d中的服务器的冷却。数据中心控制系统13特别地可以被配置为提供设定点以控制过道冷却单元9的温度和控制过道冷却单元风扇的气流水平。

存储介质13a例如可以被实施为存储器,诸如随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPROM)或电可擦可编程只读存储器(EEPROM),并且更特别地被实施为外部存储器(诸如USB(通用串行总线)存储器或闪存,诸如紧凑型闪存)中的设备的非易失性存储介质。

处理电路系统13b可以使用如下能够执行本文公开的关于优化和冷却控制的任何操作中的一个或多个操作的任何组合:合适的中央处理单元(CPU)、图像处理单元(GPU)、多重处理器、微控制器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)等等。

数据中心机房3可以包括多个温度传感器15。温度传感器15可以被配置为测量机房的多个不同点的温度。根据一些示例实施例,温度传感器可以被配置为测量冷过道中的温度,即冷过道温度。来自过道中的所有传感器15的冷过道温度的温度测量结果可以形成温度测量结果向量。温度传感器15可以被配置为与数据中心控制系统13进行通信。特别地,传感器15可以被配置为将温度测量结果发送至数据中心控制系统13。

温度测量结果可以被用于控制冷却设备,之后将对此进行更详细地描述。

数据中心控制系统13还可以被配置为获得用于每个服务器6的IT负载。

现在,将参考图2描述借助于数据中心控制系统13来控制冷却设备的冷却的方法的示例。

在步骤S1中,由数据中心控制系统13从温度传感器15获得温度测量结果。

在步骤S2中,执行对过道冷却单元9和服务器6的总电力消耗的优化。

根据优化的一个示例,可以存在对冷过道温度的约束。该约束可以涉及根据与数据中心运营者的合同的可允许的冷过道温度的范围,即,最小和最大允许合同温度。

还可以存在对过道冷却单元9所提供的气流水平的约束。对气流水平的约束例如可以基于对过道冷却单元9的物理限制,即可以由过道冷却单元9、特别是由过道冷却单元风扇递送的最小和最大气流。

步骤S2中的优化可以是多目标优化,优选是双目标优化。特别地,只有两个目标被优化。两个目标中的第一目标是过道冷却单元9的电力消耗,并且两个目标中的第二目标是服务器6的电力消耗。双目标优化公式的示例如下所示:

min{F1(T,A),F2(T,ITload)} (1)

使得Tmin≤T≤Tmax (2)

Alower≤A≤Aupper (3)

其中,F1是所有过道冷却单元9的总电力消耗,并且F1=∑F1i,其中i=1,…,n并且n是过道冷却单元9的数目,以及F1i是第i个过道冷却单元9的电力消耗。F2是所有服务器6的总电力消耗,并且F2=∑F2j,其中j=1,…,m并且m是服务器风扇11的数目。T是冷过道温度向量,该冷过道温度向量在该示例中具有长度n,并且Tmin和Tmax是冷过道温度根据合同的界限。A是过道冷却单元9的气流水平的气流水平向量,该气流水平向量具有n个要素。ITload是针对每个服务器的IT负载的固定向量。该向量具有长度k,其中k≤m并等于服务器的数目。它是在优化(1)-(3)中的输入参数,从而描述了在服务器之间的当前IT负载分布。根据优化的一些变型,可以存在有另外的约束。

在一个示例中,目标可以是以提供单一解的方式使过道冷却单元9和服务器6的总电力消耗最小化。这在一个示例中可以是多目标优化的特殊情况,其中对两个目标函数F1和F2的和进行优化。

过道冷却单元9的电力消耗例如可以是基于第一性原理(first principle)的数字模型或计算流体动力学(CFD)模型。备选地,模型可以基于实际操作数据。优化变量或决策变量是冷过道温度T和过道冷却单元9的气流水平A。额外的输入参数是针对每个服务器的IT负载的向量。

服务器6的电力消耗与速度(即服务器风扇11的角速度)和IT负载相关。数字模型能够例如被用于获得服务器6的电力消耗。备选地,来自历史记录的实际测量结果可以被用于基于测量的IT负载来确定电力消耗。历史记录例如可以被包含在查询表中,其中每个服务器6的电力消耗能够基于给定的冷过道温度来获得。IT负载是固定的输入参数并且每个服务器在特定IT负载下消耗的电力的总和是输出。可以指出,由于函数F2取决于冷过道温度,而冷过道温度部分地取决于服务器风扇11的操作,因此函数F2隐含地取决于服务器风扇的速度。

双目标优化问题可以例如借助于ε-约束法(epsilon-constraint method)、加权法或辞书方法(lexicographical method)数值地解决。

在步骤S3中,数据中心控制系统13基于在步骤S2中的优化结果来控制过道冷却单元9。

步骤S3可以涉及将设定点提供给控制过道冷却单元9的控制器。设定点用于设置过道冷却单元9中的温度和/或过道冷却单元风扇的速度,即设置气流水平。

根据一个示例,在步骤S1之前,可以对用于优化的设置进行定义。例如,可以设置是否要执行单优化和/或双优化。在双目标优化的情况中,可以确定待计算的帕累托最优解的数目,可以选择多目标优化的方法,并且可以根据方法来选择对应的参数。另外,可以定义针对优化的约束。

另外,根据一个示例,在步骤S2之前,可以执行两个初始单目标优化,针对第一目标和第二目标各自进行一次初始单目标优化,以获取针对第一目标和第二目标中的每个目标的最小值。

如果步骤S2是双目标优化,那么优化得到一组帕累托最优解。如果已经执行两个初始单目标优化,因此获得的两个解形成在帕累托前沿上的帕累托最优点。因此,它们可能被包含在该组帕累托最优解中。

如果在设置期间已经定义了可以允许多个帕累托最优解,那么帕累托最优解中的一个将被选择用于控制过道冷却单元9。

例如可以借助于预定的选择规则来选择帕累托最优解。选择规则例如可以是使用提供了过道冷却单元或服务器的最小电力消耗的那个帕累托最优解,即在两个初始单目标优化中获得的两个解中的一个。通常,所选择的帕累托最优解可以是单目标优化的提供了用于过道冷却单元9的最小电力消耗或接近过道冷却单元9的最小电力消耗的那个解,该单目标优化的目标在于使过道冷却单元9的电力消耗最小化。因此,优选地,选择帕累托最优解,其中第一目标(即过道冷却单元9的电力消耗)在某种意义上例如借助于权重被优先化。

根据一个变型,运营者或用户可以手动选择将被用于步骤S3的优选帕累托最优解。帕累托最优解例如可以被可视化为帕累托前沿,并且然后用户可以容易地对比不同的备选帕累托最优解并基于例如经验来选择最合适的一个。

在上文已参考几个示例在大体上描述了本发明的构思。然而,正如本领域技术人员容易理解的,除了在上面描述的几个实施例以外的其他实施例同样地可能落入由所附的权利要求限定的本发明的构思的范围内。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:电磁波屏蔽膜、屏蔽印制线路板的制造方法及屏蔽印制线路板

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!