随机分组方法、装置、计算机设备及存储介质

文档序号:1955266 发布日期:2021-12-10 浏览:16次 >En<

阅读说明:本技术 随机分组方法、装置、计算机设备及存储介质 (Random grouping method, device, computer equipment and storage medium ) 是由 文天才 刘保延 何丽云 雒琳 于 2021-08-06 设计创作,主要内容包括:本发明涉及数据统计领域,具体涉及一种随机分组方法、装置、计算机设备及存储介质,包括如下步骤:获取待分组样本;依次将待分组样本加入处理组中,基于每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,基于每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值;基于第一综合指标值和第二综合指标值计算得到加入有待分组样本的处理组对应的组间分布差异值,确定出组间分布差异值最小时待分组样本所加入的处理组,并将待分组样本划入处理组中。组间分布差异值能够更加准确地反应各处理组的均衡性,从而使待分组样本所选择加入的处理组更加准确,确保实验的准确性。(The invention relates to the field of data statistics, in particular to a random grouping method, a random grouping device, computer equipment and a storage medium, which comprise the following steps: obtaining a sample to be grouped; sequentially adding samples to be grouped into processing groups, obtaining a first comprehensive index value corresponding to the processing groups added with the samples to be grouped based on the qualitative data and the number of the processing groups of each processing group, and obtaining a second comprehensive index value corresponding to the processing groups added with the samples to be grouped based on the quantitative data and the number of the processing groups of each processing group; and calculating to obtain an interclass distribution difference value corresponding to the processing group added with the sample to be grouped based on the first comprehensive index value and the second comprehensive index value, determining the processing group added with the sample to be grouped when the interclass distribution difference value is minimum, and dividing the sample to be grouped into the processing group. The interclass distribution difference value can reflect the balance of each processing group more accurately, so that the processing group selected and added by the sample to be grouped is more accurate, and the accuracy of the experiment is ensured.)

随机分组方法、装置、计算机设备及存储介质

技术领域

本发明涉及数据统计领域,具体涉及一种随机分组方法、装置、计算机设备及存储介质。

背景技术

临床试验是指通过让某个特定人群参与某项临床研究,以评价某种医学治疗对健康的影响和作用。为了使临床试验获得真实、客观的结论,临床试验十分强调随机原则。

随机的作用是使各种控制因素在处理组之间均衡分布,从而消除其对研究结果的影响。通过随机化分组技术,使进入各处理组的数据可以在基线特征上尽可能保持一致,即达到统计学上的组间可比性,从而避免控制因素影响到对干预措施的效果评价。

在临床试验的动态随机化算法中,主要采用传统的最小化法。但是传统的最小化法只能直接处理分类变量而无法直接处理数值变量,且在处理分类变量时只考虑不同处理组间局部的均衡性问题,因此导致在处理同时具有分类变量与数值变量的情况下,不能准确对样本进行分组,最终影响到实验结果的准确性。

发明内容

因此,本发明要解决传统的最小化法在处理同时具有分类变量与数值变量的情况下,不能准确对样本进行分组,最终影响到实验结果的准确性的技术问题,从而提供一种随机分组方法,包括如下步骤:

获取待分组样本;其中,所述待分组样本包括定性数据和定量数据;

依次将所述待分组样本加入处理组中,基于每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,基于每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值;

基于所述第一综合指标值和所述第二综合指标值计算得到加入有待分组样本的处理组对应的组间分布差异值,确定出组间分布差异值最小时所述待分组样本所加入的处理组,并将所述待分组样本划入所述处理组中。

优选地,基于每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,基于每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值,包括:

基于每个处理组的定性数据、处理组的数量,利用第一数学模型计算得到加入有所述待分组样本的处理组对应的第一综合指标值;

基于每个处理组的定量数据、处理组的数量,利用第二数学模型计算得到加入有所述待分组样本的处理组对应的第二综合指标值。

优选地,所述第一数学模型为:

式中,G表示处理组的个数,g表示第g个处理组;L表示同一定性数据对应的类别的总数量,l表示第l个类别;fa和fe分别表示同一定性数据中在待分组样本的定性因素上的观察频数和期望频数。

优选地,所述第二数学模型为:

式中,G表示处理组的个数,g表示第g个处理组,分别表示从所有处理组中取出任意两处理组在待分组样本的定量因素上的均值,分别表示从所有处理组中取出任意两处理组在待分组样本的定量因素上的方差,n1和n2分别表示从所有处理组中取出任意两处理组的样本量。

优选地,所述基于所述第一综合指标值和所述第二综合指标值计算得到组间分布差异值,包括:

基于所述第一综合指标值和所述第二综合指标值,利用第三数学模型计算得到所述组间分布差异值。

优选地,所述第三数学模型为:

式中,M表示分层因素的个数,m表示第m个分层因素,wm表示第m个分层因素的权重,当第m个分层因素的属性为定性数据时,dm=dc,当第m个分层因素的属性为定量数据时,dm=dn。

优选地,在所述基于所述第一综合指标值和所述第二综合指标值计算得到组间分布差异值之前,还包括:

对所述第一综合指标值和/或所述第二综合指标值进行归一化处理。

本实施例还提供了一种随机分组装置,包括:

获取模块,用于获取待分组样本;其中,所述待分组样本包括定性数据和定量数据;

计算模块,用于依次将所述待分组样本加入处理组中,基于每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,基于每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值;

划分模块,用于基于所述第一综合指标值和所述第二综合指标值计算得到加入有待分组样本的处理组对应的组间分布差异值,确定出组间分布差异值最小时所述待分组样本所加入的处理组,并将所述待分组样本划入所述处理组中。

本实施例还提供了一种计算机设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行上述的随机分组方法。

本实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行上述的随机分组方法。

本发明技术方案,具有如下优点:

1.本发明提供的随机分组方法,获取到的待分组样本包括定性数据和定量数据,利用每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,利用每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值。

第一综合指标值是根据所有处理组的定性数据得到的,综合考虑待分组样本中的定性数据对所有处理组的影响;第二综合指标值是直接根据定量数据得到的,不需要将数值变量转化为分类变量,从而保存了数值本身所包含的信息,且综合考虑待分组样本中的定量数据对所有处理组的影响。

再根据第一综合指标值和第二综合指标值得到对应处理组的组间分布差异值,所述组间分布差异值能够更加准确地反应各处理组的均衡性,从而使待分组样本所选择加入的处理组更加准确,确保实验的准确性。

附图说明

为了更清楚地说明本发明

具体实施方式

或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例1随机分组方法的流程图;

图2为本发明实施例2随机分组装置的结构框图;

图3为本发明实施例3计算机设备的结构原理图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

临床试验为了保证实验的真实性和准确性,通常会采用随机原则对实验数据进行分组。目前采取的动态随机算法主要有传统的最小化法,但传统的最小化法无法直接处理数值变量,需要将数值变量转化成分类变量,并利用转化后的分类变量进行计算。

将数值变量转化为分类变量会导致数值本身的信息损失,在存在多个分层因素为数值变量时,数值变量本身损失的信息会更多,从而严重影响到实验结果的准确性。并且,传统的最小化法在处理分类变量时,只考虑不同处理组间局部的均衡性问题,导致可能存在计算分类变量时结果不精确的情况。因此,在同时面对涉及分类变量与数值变量的情况下,传统的最小化法并不能很好地实现对样本进行分组,最终影响实验结果的准确性。

实施例1

本实施例提供了一种随机分组方法,图1是说明根据本发明某些实施例,将待分组样本依次加入处理组中,基于每个处理组的定性数据、处理组的数量得到第一综合指标值,基于每个处理组的定量数据、处理组的数量得到第二综合指标值,并基于第一综合指标值和第二综合指标值将待分组样本划入处理组中的流程图。虽然下文描述的过程包括以特定的顺序出现的多个操作,但是应该清楚地了解到,这些过程也可以包括更多或者更少的操作,这些操作可以顺序执行或者并行执行(例如使用并行处理器或者多线程环境)。

本实施例提供了一种随机分组方法,用于对样本数据进行分组,以得到组间差异值最小的分组方法。其中,所述样本数据可以为临床数据,例如:患者性别、年龄、肿瘤直径和血压等等。如图1所示,包括如下步骤:

S101、获取待分组样本。

在上述实施步骤中,待分组样本包括定性数据和定量数据。其中,定性数据属于分类变量,定量数据属于数值变量。

举例来说,待分组样本的数据包括:肿瘤直径为20.1、性别为女的患者a,肿瘤直径为19.9、性别为女的患者b以及肿瘤直径为20、性别为男的患者c,则定性数据包括患者a的性别:女、患者b的性别:女、患者c的性别:男;定量数据包括患者a的肿瘤直径:20.1、患者b的肿瘤直径:19.9、患者c的肿瘤直径:20。

S102、依次将所述待分组样本加入处理组中,基于每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,基于每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值。

在上述实施步骤中,处理组的数量包括多个,且每个处理组中可存在多个已分组数据,且每个处理组中包含的数据与待分组样本的数据在分层因素上相同。例如,待分组样本为肿瘤直径为20.1、性别为女的患者a,则每个处理组均包括有肿瘤直径、性别的数据,处理组可如下表1所示。

表1

将待分组样本依次加入处理组中,基于每个处理组的定性数据和处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,所述第一综合指标值表征定性数据(即分类变量)对组间差异的影响;基于每个处理组的定量数据和处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值,所述第二综合指标值表征定量数据(即数值变量)对组间差异的影响。

其中,第一综合指标值考虑了所有处理组间、所有定性数据的均衡性,即考虑所加入的定性数据对全局的影响。第二综合指标值直接采用定量数据计算得出,而不需要将数值变量转换为分类变量,因此不会损失数值变量本身所包含的信息。

举例来说,如表1所示,处理组包括A组和B组共2组,可依次将待分组样本肿瘤直径为20.1、性别为女的患者a加入A组和B组中。假设将待分组样本加入A组,则利用A组和B组的性别(男或女)计算得到A组的第一综合指标值,利用A组和B组的肿瘤直径计算得到A组的第二综合指标值;假设将待分组样本加入B组,则利用A组和B组的性别(男或女)计算得到B组的第一综合指标值,利用A组和B组的肿瘤直径计算得到B组的第二综合指标值。

在计算第一综合指标值时,可利用第一数学模型进行计算;在计算第二综合指标值时,可利用第二数学模型进行计算。即,将每个处理组的定性数据、处理组的数量代入第一数学模型得到第一综合指标值,将每个处理组的定量数据、处理组的数量代入第二数学模型得到第二综合指标值。

S103、基于所述第一综合指标值和所述第二综合指标值计算得到加入有待分组样本的处理组对应的组间分布差异值,确定出组间分布差异值最小时所述待分组样本所加入的处理组。

在上述实施步骤中,根据第一综合指标值和第二综合指标值得到加入有待分组样本的处理组对应的组间分布差异值,组间分布差异值结合了定性数据和定量数据对组间差异的影响,能够更加准确地反映出待分组样本(包括定性数据和定量数据)对组间均衡性的影响。

在得到所有处理组对应的组间分布差异值后,确定出组间分布差异值最小时待分组样本所加入的处理组。组间分布差异值越大,则表示对应分组方式使得两组差异变得越大;组间分布差异值越小,则表示对应分组方式使得两组差异变得越小。

举例来说,如上表1所示,假设将待分组样本:肿瘤直径为20.1、性别为女的患者a加入A组,则计算得到A组的第一综合指标值和A组的第二综合指标值;假设将待分组样本:肿瘤直径为20.1、性别为女的患者a加入B组,则计算得到B组的第一综合指标值和B组的第二综合指标值。

利用A组的第一综合指标值和A组的第二综合指标值,计算得到A组的组间分布差异值;利用B组的第一综合指标值和B组的第二综合指标值,计算得到B组的组间分布差异值,比较A组的组间分布差异值和B组的组间分布差异值,确定出组间分布差异值最小时,待分组样本:肿瘤直径为20.1、性别为女的患者a所加入的处理组。例如,A组的组间分布差异值最小,则待分组样本:肿瘤直径为20.1、性别为女的患者a所加入的处理组为A组。

S104、将所述待分组样本划入所述处理组中。

在上述实施步骤中,所述处理组为组间分布差异值最小时所述待分组样本所加入的处理组。组间分布差异值越小,则表示加入所述待分组样本能使两组差异变得越小,从而使得实验结果更加精确。

举例来说,如上表1所示,假设将待分组样本:肿瘤直径为20.1、性别为女的患者a加入A组和B组,确定出A组的组间分布差异值最小,则将待分组样本:肿瘤直径为20.1、性别为女的患者a加入A组。

在上述实施例中,获取到的待分组样本包括定性数据和定量数据,利用每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,利用每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值。

第一综合指标值是根据所有处理组的定性数据得到的,综合考虑待分组样本中的定性数据对所有处理组的影响;第二综合指标值是直接根据定量数据得到的,不需要将数值变量转化为分类变量,从而保存了数值本身所包含的信息,且综合考虑待分组样本中的定量数据对所有处理组的影响。

再根据第一综合指标值和第二综合指标值得到对应处理组的组间分布差异值,所述组间分布差异值能够更加准确地反应各处理组的均衡性,从而使待分组样本所选择加入的处理组更加准确,确保实验的准确性。

在一个或多个实施例中,所述第一数学模型为:

式中,G表示处理组的个数,g表示第g个处理组;L表示同一定性数据对应的类别的总数量,l表示第l个类别;fa和fe分别表示同一定性数据中在待分组样本的定性因素上的观察频数和期望频数。

在一个或多个实施例中,所述第二数学模型为:

式中,G表示处理组的个数,g表示第g个处理组,G!表示G的阶乘;分别表示从所有处理组中取出任意两处理组在待分组样本的定量因素上的均值,分别表示从所有处理组中取出任意两处理组在待分组样本的定量因素上的方差,n1和n2分别表示从所有处理组中取出任意两处理组的样本量。

举例来说,在一个临床研究中有两个处理组——A组与B组,以肿瘤直径和性别作为分层因素,当前该研究中各组的受试者分布情况如下表2,其中性别栏中“1”表示性别为男、“2”表示性别为女。

表2

在本示例中,如表2所示,第一数学模型中的“L”为性别:男、女两个类别。在一些实施例中,同一定性数据对应的类别的总数量可以大于2个,例如肺癌按病理类型可分为:肺腺癌、肺鳞癌和小细胞肺癌,则肺癌中的类别数量为3个。

现有一名新的受试者要加入该研究,其肿瘤直径为20.1,性别为女。采用第二数学模型计算A组的第二综合指标值和B第二综合指标值,计算过程可如下所示:

1)假设将该受试者分入A组

A组均值:

B组均值:

A组方差:

B组方差:

由于示例中处理组的数量为2,即G=2,因此只存在一种组合。则A组对应的第二综合指标值为:

2)假设将该受试者分入B组

A组均值:

B组均值:

A组方差:

B组方差:

由于示例中处理组的数量为2,即G=2,因此只存在一种组合。则B组对应的第二综合指标值为:

需要说明的是,采用第二数学模型计算第二综合指标值时,如果处理组的数量为三个以上,则第二数学模型不仅要考虑加入有待分组样本的处理组与未加入有待分组样本的处理组,还需要考虑未加入有待分组样本的处理组与不同的未加入有待分组样本的处理组。

举例来说,处理组包括A组、B组、C组和D组,采用第二数学模型计算第二综合指标值得到:假设放入A组的第二综合指标值、假设放入B组的第二综合指标值、假设放入C组的第二综合指标值和假设放入D组的第二综合指标值。在采用第二数学模型计算A组(加入有待分组样本)的第二综合指标值时,不仅要考虑A组与B组、A组与C组、A组与D组,还需要考虑B组与C组、B组与D组、C组与D组,即综合考虑所有处理组之间的关系计算得到假设分入A组的第二综合指标值,使得计算结果更加准确。

采用第一数学模型计算A组的第一综合指标值和B第一综合指标值,计算过程可如下所示:

1)假设将该受试者分入A组,其中:

fa(A,男)=3

fa(A,女)=6

fa(B,男)=4

fa(B,女)=3

则A组对应的第一综合指标值为:

2)假设将该受试者分入B组,其中:

fa(A,男)=3

fa(A,女)=5

fa(B,男)=4

fa(B,女)=4

则B组对应的第一综合指标值为:

需要说明的是,第一数学模型在计算同一定性数据对应的类别大于2个时,需要计算每个组中每个类别的观察频数和期望频数。例如,处理组包括C组和D组,C组和D组中均包括肺癌病理类型:肺腺癌、肺鳞癌、和小细胞肺癌。现需将新的测试者e(肺鳞癌)加入C组或D组,在计算C组的第一综合指标值和D组的第一综合指标值时,则观察频数包括:fa(C,肺腺癌)、fa(C,肺鳞癌)、fa(C,小细胞肺癌)、fa(D,肺腺癌)、fa(D,肺鳞癌)和fa(D,小细胞肺癌);期望频数包括:fe(C,肺腺癌)、fe(C,肺鳞癌)、fe(C,小细胞肺癌)、fe(D,肺腺癌)、fe(D,肺鳞癌)和fe(D,小细胞肺癌)。

在一个或多个实施例中,可以采用第三数学模型计算得到组间分布差异值,即将同一处理组的第一综合指标值和第二综合指标值代入第三数学模型中,得到组间分布差异值。其中,所述第三数学模型可以为:

式中,M表示分层因素的个数,m表示第m个分层因素,wm表示第m个分层因素的权重,当第m个分层因素的属性为定性数据时,dm=dc,当第m个分层因素的属性为定量数据时,dm=dn。

举例来说,上表2中包括肿瘤直径和性别两个分层因素,为计算简便,肿瘤直径和性别的权重均设为1,则A组的组间分布差异值为:DA=dnA+dcA=0.8664+0.9070=1.7734,B组的组间分布差异值为:DB=dnB+dcB=0.9573+0.2540=1.2113。

由此可见,新受试者加入A组会使组间更不均衡,故应分入B组。

使用传统的最小化法,计算肿瘤大小为20.1的女性患者进入A组或B组,只需要关注A组和B组中肿瘤大小≥20和女性层中的频数,其结果可如下表3所示:

通过频数统计发现,将新受试者分入A组将使两组间差异更大,故应分入B组。虽然本实施例提供的方法与传统的最小化法计算结果一样,但可以明显地看到,本实施例提供的方法更注意试验的整体而不是局部。

通过统计学检验,如果只考虑肿瘤大小差异应将新受试者分入A组(传统最小化法和本实施例提供的方法t检验p值分别为0.4226和0.3857,相差0.0369);如果只考虑性别差异则应将新受试者分入B组(传统最小化法和本实施例提供的方法卡方检验p值分别为0.3409和0.6143,相差0.2734)。综合分析发现,在两种不同的分法中,性别之间在差异要大于肿瘤大小,故将受试者分入B组更加兼顾了试验的整体不均衡性。

需要说明的是,在处理包括3个及3个以上分层因素的数据时,第三数学会综合所有分层因素对组间差异的影响。例如:针对肺癌病理类型、性别和年龄三个分层因素,计算处理组E组的组间分布差异值时,需要先计算E组中肺癌病理类型的第一综合指标值、E组中性别的第一综合指标值和E组中年龄的第二综合指标值。在一些实施例中,可利用乘积的形式计算得到组间分布差异值,或者对第三数学模型进行适应调整,例如增加调整参数等。同时,第一数学模型和第二数学模型也可进行适应性调整,例如增加调整参数等。

在一个或多个实施例中,在基于第一综合指标值和第二综合指标值计算得到组间分布差异值之前,还包括:对第一综合指标值和/或第二综合指标值进行归一化处理。

在得到第一综合指标值后,可将其归一化到[0,1]之间,即:

式中,dcmin是表示所有dc中的最小值,dcmax是表示所有dc中的最大值。

在得到第二综合指标值后,可将其归一化到[0,1]之间,即:

式中,dnmin是表示所有dn中的最小值,dnmax是表示所有dn中的最大值。

在第一综合指标值和第二综合指标值计算阶段,归一化的目的是使定性结果和定量结果可以放到一个可比的尺度上。如果研究人员认为可不要进行归一化处理,则可以直接使用第一综合指标值的原值和/或第二综合指标值的原值进行一下步计算。即,可直接使用权重(第三数学模型中的权重)来进行尺度的校正。

在本实施例中,归一化和权重两者可以同时使用,或使用其中一种,具体情况可以根据研究需要决定。且上述方法实施例不仅可在临床医疗领域进行随机分组,还可以在其他领域进行随机分组。

实施例2

本实施例提供了一种随机分组装置,用于对样本数据进行分组,以得到组间差异值最小的分组方法。如图2所示,包括:

获取模块201,用于获取待分组样本;其中,所述待分组样本包括定性数据和定量数据。详细内容请参见实施例1中步骤S101的相关描述,此处不再赘述。

计算模块202,用于依次将所述待分组样本加入处理组中,基于每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,基于每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值。详细内容请参见实施例1中步骤S102的相关描述,此处不再赘述。

划分模块203,用于基于所述第一综合指标值和所述第二综合指标值计算得到加入有待分组样本的处理组对应的组间分布差异值,确定出组间分布差异值最小时所述待分组样本所加入的处理组,并将所述待分组样本划入所述处理组中。详细内容请参见实施例1中步骤S103和步骤S104的相关描述,此处不再赘述。

在上述实施例中,获取模块201获取到的待分组样本包括定性数据和定量数据,计算模块202利用每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,并利用每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值。第一综合指标值是根据所有处理组的定性数据得到的,综合考虑待分组样本中的定性数据对所有处理组的影响;第二综合指标值是直接根据定量数据得到的,不需要将数值变量转化为分类变量,从而保存了数值本身所包含的信息,且综合考虑待分组样本中的定量数据对所有处理组的影响。再根据第一综合指标值和第二综合指标值得到对应处理组的组间分布差异值,所述组间分布差异值能够更加准确地反应各处理组的均衡性,从而使划分模块203所选择加入的处理组更加准确,确保实验的准确性。

实施例3

本实施例提供了一种计算机设备,如图3所示,该设备包括处理器301和存储器302,其中处理器301和存储器302可以通过总线或者其他方式连接,图3中以通过总线连接为例。

处理器301可以为中央处理器(Central Processing Unit,CPU)。处理器301还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、图形处理器(Graphics Processing Unit,GPU)、嵌入式神经网络处理器(Neural-network ProcessingUnit,NPU)或者其他专用的深度学习协处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。

存储器302作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的随机分组方法对应的程序指令/模块(如图2所示的获取模块201、计算模块202和划分模块203)。处理器301通过运行存储在存储器302中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例1中的随机分组方法。

存储器302可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器301所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器302可选包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至处理器301。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器302中,当被所述处理器301执行时,执行如图1所示实施例中的随机分组方法。

在本实施例中,存储器302存储有随机分组方法的程序指令或模块,处理器301执行存储在存储器302内的程序指令或模块时,获取到的待分组样本包括定性数据和定量数据,利用每个处理组的定性数据、处理组的数量得到加入有待分组样本的处理组对应的第一综合指标值,利用每个处理组的定量数据、处理组的数量得到加入有待分组样本的处理组对应的第二综合指标值。

第一综合指标值是根据所有处理组的定性数据得到的,综合考虑待分组样本中的定性数据对所有处理组的影响;第二综合指标值是直接根据定量数据得到的,不需要将数值变量转化为分类变量,从而保存了数值本身所包含的信息,且综合考虑待分组样本中的定量数据对所有处理组的影响。

再根据第一综合指标值和第二综合指标值得到对应处理组的组间分布差异值,所述组间分布差异值能够更加准确地反应各处理组的均衡性,从而使待分组样本所选择加入的处理组更加准确,确保实验的准确性。

本发明实施例还提供一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的随机分组方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。

显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种电子知情同意方法和系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!