计算机提高算力和降低功耗算力比的方法及系统

文档序号:1295934 发布日期:2020-08-07 浏览:37次 >En<

阅读说明:本技术 计算机提高算力和降低功耗算力比的方法及系统 (Method and system for increasing computing power and reducing computing power ratio of computer ) 是由 刘建波 马伟斌 黄理洪 杨作兴 郭海丰 于 2020-04-14 设计创作,主要内容包括:本发明公开了一种具有多计算核的计算机提高算力和降低功耗算力比的方法,本发明实施例在具有多计算核的计算机中的每个芯片中,设置一个主时频单元及至少一个附属时频单元,其中,主时频单元的时钟频率、所述芯片中的由主时频单元提供时钟频率的计算核、及所述芯片中的由附属时频单元提供时钟频率的计算核是经过测试确定的,满足所述芯片中的计算核运行正常通过率大于或等于设定的通过率阈值,从而能够让所述芯片中的最大数目的计算核运行正常。这样,本发明实施例的具有多计算核的计算机就可以提高算力和降低功耗算力比。(The invention discloses a method for improving computing power and reducing power consumption computing power ratio of a computer with multiple computing cores. Thus, the computer with multiple computing cores of the embodiment of the invention can improve the computing power and reduce the power consumption computing power ratio.)

计算机提高算力和降低功耗算力比的方法及系统

技术领域

本发明涉及计算机技术领域,特别涉及一种具有多计算核的计算机提高算力和降低功耗算力比的方法及系统。

背景技术

随着计算机技术的进步,各种具有超强算力的计算机出现了,这种计算机可以应用到各种所需的要求强算力的应用领域中,比如作为虚拟货币挖矿机用于赚取虚拟货币。通常,这种计算机中包括多个芯片,每个芯片中具有多个计算核,多个计算核并行进行大数据量的计算,当作为虚拟货币挖矿机时,实现在较短的时间获取更多的虚拟货币,功耗较大。当这种计算机作为虚拟货币挖矿机时,下载挖矿软件,在多个计算核中并行运行挖矿软件中的挖矿算法,与远方挖矿服务器进行通信,通信匹配后就可得到相应的虚拟货币。

这种具有多计算机核的计算机在进行计算时为了实现最高算力和最低功耗算力比,在每个芯片中设置了多个并行运行的计算核,并行进行计算。对于这种计算机中的每个计算核,在理想状态下,希望都能够达到最高算力和最低功耗比。但是,考虑到这种计算机整机运行的稳定性及为各个计算核提供时钟频率的诸如锁相环模块(PLL)或锁频环模块(FLL)的时频单元所占的面积及功耗,一个芯片中的所有计算核同时由设置在该芯片中的一个时频单元提供时钟频率,也就是说,这种计算机中的每个芯片只有一个时频单元用于为该芯片中的所有计算核提供统一的时钟频率。在这种情况下,为了保证这种计算机中的该芯片中的所有计算核都能够正常运行,该芯片的时频单元提供的时钟频率是由算力最差的计算核所需的时钟频率确定的,而对于该芯片中的其他计算核,基于所确定的时钟频率进行运行,则无法达到其最高的算力,为了提高算力,会提高该芯片运行电压,功耗就会相应增加,这带来了这种计算机的算力损失和功耗算力比的增加。

发明内容

有鉴于此,本发明实施例提供一种具有多计算核的计算机提高算力和降低功耗算力比的方法,该方法能够提高具有多计算核的计算机的算力和降低功耗算力比。

本发明实施例还提供一种具有多计算核的计算机提高算力和降低功耗算力比的系统,该系统能够提高具有多计算核的计算机的算力和降低功耗算力比。

本发明实施例是这样实现的:

一种具有多计算核的计算机提高算力和降低功耗算力比的方法,所述包括:

在具有多计算核的计算机的每个芯片中,设置一个主时频单元及至少一个附属时频单元;

所述主时频单元的时钟频率、所述芯片中的由主时频单元提供时钟频率的计算核、及所述芯片中的由附属时频单元提供时钟频率的计算核经过测试确定,满足所述芯片中的计算核运行正常通过率大于或等于设定的通过率阈值。

可选的,所述主时频单元的时钟频率、所述芯片中的由主时频单元提供时钟频率的计算核、及所述芯片中的由附属时频单元提供时钟频率的计算核经过测试确定包括:

A、启动芯片,所述芯片中的主时频单元为所述芯片中的所有计算核提供初始时钟频率;

B、所述芯片中的所有计算核在发送的测试激励下进行运行测试,判断所述芯片中进行测试的计算核通过测试的通过率是否大于或等于设定的通过率阈值,如果是,执行步骤C;如果否,则执行步骤D;

步骤C、将所述芯片中的主时频单元的时钟频率递增设定的频率差值,返回步骤B继续执行;

步骤D、将所述芯片中未通过测试的计算核切换到附属时频单元上,由附属时频单元采用设置的时钟频率提供时钟频率,返回步骤B执行。

可选的,判断所述芯片中的进行测试的计算核通过测试的通过率是否大于或等于设定的通过率阈值还包括:

判断所述芯片中的进行测试的计算核通过测试的通过率等于设定的通过率阈值,或者大于设定的通过率阈值在设定的范围内时,结束测试;

在结束测试时,将主时频单元当前提供的时钟频率、由主时频单元当前提供时钟频率的计算核、由附属时频单元当前提供时钟频率的计算核,分别作为所述芯片中的主时频单元的时钟频率、由主时频单元提供时钟频率的计算核、及由附属时频单元提供时钟频率的计算核。

可选的,所述附属时频单元提供的时钟频率采用预设值,或者采用主时频单元提供的时钟频率与预设的阶梯差值之间的差值。

可选的,所述附属时频单元有多个,分别为不同的计算核提供时钟频率,所述不同附属时频单元提供的时钟频率不同。

可选的,所述测试是在所述具有多计算核的计算机初始化时进行的。

一种提高虚拟货币挖矿机的算力和降低功耗算力比的系统,所述系统包括具有多计算核的计算机中的多个芯片,其中,每个芯片包括:主时频单元、附属时频单元及多个计算核,其中,

主时频单元,用于为所述系统中的部分计算核提供时钟频率;

附属时频单元,用于为所述系统中的另外部分计算核提供时钟频率;

所述主时频单元的时钟频率、所述芯片中的由主时频单元提供时钟频率的计算核、及所述芯片中的由附属时频单元提供时钟频率的计算核经过测试确定,满足所述芯片中的计算核运行正常通过率大于或等于设定的通过率阈值。

可选的,所述附属时频单元提供的时钟频率采用预设值,或者采用主时频单元提供的时钟频率与预设的阶梯差值之间的差值。

可选的,所述附属时频单元有多个,分别为不同的计算核提供时钟频率,所述不同附属时频单元提供的时钟频率不同。

可选的,所述测试是在所述具有多计算核的计算机初始化时进行的。

如上所见,本发明实施例在具有多计算核的计算机中的每个芯片中,设置一个主时频单元及至少一个附属时频单元,其中,主时频单元的时钟频率、所述芯片中的由主时频单元提供时钟频率的计算核、及所述芯片中的由附属时频单元提供时钟频率的计算核是经过测试确定的,满足所述芯片中的计算核运行正常通过率大于或等于设定的通过率阈值,从而能够让所述芯片中的最大数目的计算核运行正常。这样,本发明实施例的具有多计算核的计算机就可以提高算力和降低功耗算力比。

附图说明

图1为本发明实施例提供的具有多计算核的计算机提高算力和降低功耗算力比的方法流程图;

图2为本发明实施例提供的测试过程的方法流程图;

图3为本发明实施例提供的具有多计算核的计算机提高算力和降低功耗算力比的系统结构示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。

本发明实施例为了使得诸如虚拟货币挖矿机的具有多计算核的计算机提高算力和降低功耗算力比,在具有多计算核的计算机的每个芯片中,设置一个主时频单元及至少一个附属时频单元,其中,主时频单元的时钟频率、所述芯片中的由主时频单元提供时钟频率的计算核、及所述芯片中的由附属时频单元提供时钟频率的计算核是经过测试确定的,满足所述芯片中的计算核运行正常通过率大于或等于设定的通过率阈值,从而能够让所述芯片中的最大数目的计算核运行正常。

更进一步地,附属时频单元提供的时钟频率是预设值,或者是根据主时频单元提供的时钟频率及预设的阶梯差值确定的。

在本发明实施例中,主时频单元和附属时频单元都可以是PLL,或者是FLL,只要为计算核提供时钟频率即可。

图1为本发明实施例提供的具有多计算核的计算机提高算力和降低功耗算力比的方法流程图,其具体步骤为:

步骤101、在具有多计算核的计算机的每个芯片中,设置一个主时频单元及至少一个附属时频单元;

步骤102、所述主时频单元的时钟频率、所述芯片中的由主时频单元提供时钟频率的计算核、及所述芯片中的由附属时频单元提供时钟频率的计算核是经过测试确定的,满足所述芯片中的计算核运行正常通过率大于或等于设定的通过率阈值。

在该方法中,所述附属时频单元提供的时钟频率采用预设值,或者根据主时频单元提供的时钟频率及预设的阶梯差值确定,具体为主时频单元提供的时钟频率与预设的阶梯差值之间的差值。

在该方法中,所述测试过程是所述具有多计算核的计算机在进行初始化时进行的。

在该方法中,所述附属时频单元有至少一个,分别为不同的计算核提供时钟频率;其中,每个附属时频单元提供的时钟频率采用预设值,或者根据主时频单元提供的时钟频率及预设的阶梯差值确定,不同附属时频单元提供的时钟频率可以不同。

在该方法中,如图2所示,图2为本发明实施例提供的测试过程的方法流程图,其具体步骤为:

步骤201、启动芯片后,所述芯片中的主时频单元为所述芯片中的所有计算核提供初始时钟频率;

在该步骤中,所述芯片中的主时频单元提供初始时钟频率是一个较低的频率值,具体地,为了使得具有多计算核的计算机预热以及保持运行稳定,主时频单元会从低时钟频率向高时钟频率逐渐上升,起始的较低频率可以是一个人为设定的经验值,也可以设定为该芯片中的算力最差的计算核所需的时钟频率,当然也可以设定为其他的时钟频率,而并不一定是该芯片中的算力最差的计算核所需的时钟频率;

在该步骤中,附属时频单元提供的时钟频率可以由该芯片中的算力最差的计算核所需的时钟频率确定,该芯片中的算力最差的计算核所需的时钟频率是基于同等工艺条件下的计算核所需的时钟频率经验值确定的;

步骤202、所述芯片中的所有计算核在发送的测试激励下进行测试;

在该步骤中,测试激励是由所述计算机的中央处理器发送给每个芯片中的计算核的,计算核在接收后基于测试激励运行,反馈测试激励响应,以便后续所述计算机的中央处理器根据激励响应判断计算核是否运行正常,如果是,则该计算核测试通过,如果否,则该计算核测试不通过;

步骤203、判断所述芯片中的进行测试的计算核的测试通过率是否大于或等于设定的通过率阈值,如果是,执行步骤204;如果否,则执行步骤205;

步骤204、将所述芯片中的主时频单元的时钟频率递增设定的频率差值,返回步骤202继续执行;

在该步骤中,所设定的频率差值可以是预设的经验值,这里不具体限定;

步骤205、将所述芯片中未通过运行测试的计算核切换到附属时频单元上,由附属时频单元采用设置的时钟频率为其提供时钟频率,返回步骤202执行;

在该步骤中,附属时频单元的时钟频率可以为固定值,该固定值是所述工艺条件下芯片的最慢时钟频率的经验值,也就是短板效应的短板值,比如是芯片中的算力最差的计算核所需的时钟频率;也可以是一个变化值,该变化值是根据主时频单元提供的时钟频率及预设的阶梯差值确定的,也就是主时频单元提供的时钟频率及预设的阶梯差值之间的差值,该阶梯差值可以是根据所述工艺条件下芯片中的不同计算核的工作时钟差值范围及经验值结合确定的。

在该步骤中,如果有多个附属时频单元,也可以将所述芯片中未通过运行测试的计算核分别切换到不同的附属时频单元上,由不同的附属时频单元为切换到自身的计算核提供时钟频率。在这里,将所述芯片中未通过运行测试的计算核分别切换到不同的附属时频单元上可以根据设置的切换方式进行,所设置的切换方式有多种,比如:随机切换方式或轮询切换方式等等。

图2所述的过程虽然使得芯片中的计算核要经过多次切换才能确定为其提供时钟频率的时频单元(可以是主时频单元或者是附属时频单元),但是由于图2所述的过程是在测试时进行的,具体是在计算机初始化时进行的,所以在计算机后续的工作状态下,就不会再进行计算核的时钟频率切换,不会影响计算机中各个芯片的工作稳定性。

在图2所述的过程中,当步骤203判断所述芯片中的进行测试的计算核通过测试的通过率是否大于或等于设定的通过率阈值还包括:

当判断所述芯片中的进行测试的计算核通过测试的通过率等于设定的通过率阈值,或者大于设定的通过率阈值在设定范围内时,则结束测试过程,所述设定范围通常为所设定的一个比较小的范围;

在结束测试过程时,就确定了主时频单元提供的时钟频率具体是多少,及为所述芯片中的哪些计算核提供主时钟频率;以及附属时频单元为所述芯片中的哪些计算核提供附属时钟频率。

其中,设定范围是一个经验值,其不会超过通过率阈值很多,比如两者差值仅仅是个位数级别。也就是说,设定范围实际上就是通过率阈值的一个修订范围值,来保证仅仅大于通过率阈值时的修订范围值时,整个测试也就是结束了。如果设定范围设置的很大,超过修订范围值,则存在问题,说明整个测试过程中芯片的各个计算核还没有最终确定出最合适的时钟频率,仍然需要按照图2的过程继续执行,直到为芯片中的各个计算核确定出最合适的时钟频率。

以下以具有多计算核的计算机为虚拟货币挖矿机为例,对采用本发明实施例的测试方法进行具体说明。

第一个步骤,虚拟货币挖矿机中的一个芯片启动,同时开启该芯片的2个或更多时频单元。在这里,开启时频单元的数目取决于芯片内的时频单元数目,将1个性能最佳的时频单元设置为主时频单元,该时频单元提供一个较低的起始时钟频率,从低时钟频率逐步上升到高时钟频率对芯片中的计算核测试;同时也将另外的时频单元设置为附属时频单元,设定固定时钟频率,该固定时钟频率值是将在该工艺条件下芯片最慢频率的经验值,也就是短板效应的短板值。根据可以使用的附属时频单元的数目,分阶梯的去设置相对较低的时钟频率值,也就是不同的附属时频单元设置的固定时钟频率可以是不同的。

在该步骤中,根据芯片所设置的工艺条件,就已知了各个时频单元的性能,将其中的性能最佳的视频单元作为主时频单元。

第二个步骤,采用主时频单元为所述芯片中的每个计算核提供由低到高的时钟频率,时钟频率由低开始,每次增加设定的频率差值,发送测试激励使得所述芯片中的每个计算核进行运行测试,检查所有计算核是否通过测试,当通过率达到要求,将继续升时钟频率,当通过率没有达到要求,进行进一步的分析。

第三步骤、当通过率达不到要求时,也就是有一部分工艺偏差大的计算核无法在目前的时钟频率下运行正常,导致所述芯片中的计算核的运行测试失败率增多,不能再继续提高主时频单元的时钟频率,否则很多计算核不能正常工作,损失算力。此时可以将这部分计算核切换到之前设定的提供相对低的时钟频率的附属时频单元上,其他计算核继续由主时频单元提供时钟频率,同时主时频单元继续升频。

第四步骤、经过运行测试,切换到附属时频单元的计算核可以成功通过测试,并且附属时频单元的频率是之前设定好的,不会发生变动,所以这些计算核将会稳定的工作。这样整体测试通过率提高,主时频单元会保持将时钟频率继续升频,当又有一批计算核测试运行失败时,继续重复第三个步骤和第四个步骤,如果有其他的附属时频单元没有使用,比如提供的时钟频率相对最慢的附属时频单元快一些,也可以将新的一批测试失败的计算核切换到新的附属时频单元,可以提高更多的算力。

这样,本发明实施例通过对所述芯片中的少部分的算力不强的计算核切换到提供相对低时钟频率的附属时频单元上,让所述芯片中的大多数计算核具有其能够具有的最高算力,有效提高了算力和降低了功耗算力比。

图3为本发明实施例提供的具有多计算核的计算机提高算力和降低功耗算力比的系统结构示意图,所述系统包括具有多计算核的计算机中的至少一个芯片,其中,每个芯片包括:主时频单元、附属时频单元及多个计算核,其中,

主时频单元,用于为所述系统中的部分计算核提供时钟频率;

附属时频单元,用于为所述系统中的另外部分计算核提供时钟频率;

所述主时频单元的时钟频率、所述芯片中的由主时频单元提供时钟频率的计算核、及所述芯片中的由附属时频单元提供时钟频率的计算核是经过测试确定的,满足所述芯片中的计算核运行正常通过率大于或等于设定的通过率阈值。

在该系统中,所述系统还包括中央处理器,用于控制主时频单元设置时钟频率及对计算核进行主时频单元及附属时频单元的切换。

在该系统中,所述附属时频单元提供的时钟频率采用预设值,或者根据主时频单元提供的时钟频率及预设的阶梯差值确定,具体为主时频单元提供的时钟频率与预设的阶梯差值之间的差值。

在该系统中,所述测试过程是所述系统在初始化时进行的。

在该系统中,所述附属时频单元有至少一个,分别为不同的计算核提供时钟频率;其中,每个附属时频单元提供的时钟频率采用预设值,或者根据主时频单元提供的时钟频率及预设的阶梯差值确定,不同附属时频单元提供的时钟频率不同。

如果在诸如虚拟货币挖矿机的具有多计算核的计算机中的工作状态下,频繁动态切换芯片中的时频单元,则会使得芯片的电压不稳定,从而影响具有多计算核的计算机的稳定性,本发明实施例采用测试方法,在芯片初始化阶段,就确定了主时频单元的时钟频率、所述芯片中的由主时频单元提供时钟频率的计算核、及所述芯片中的由附属时频单元提供时钟频率的计算核,在实际运行中不需要再频繁切换芯片中的时频单元,从而保持了具有多计算核的计算机工作的稳定性,同时又能将算力较差的计算核正确地切换到对应的多档附属时频单元上,由多档附属时频单元提供时钟频率,也不需要提高芯片电压去提高芯片中的计算核的算力,使得诸如虚拟货币挖矿机的具有多计算核的计算机具有更高的算力和更低的功耗算力比。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:超低功耗微控制处理器时钟自校正单元

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!