一种多层分组的多维统计分析方法
阅读说明:本技术 一种多层分组的多维统计分析方法 (Multi-dimensional statistical analysis method for multi-layer grouping ) 是由 陈波 杜易霖 余智华 于 2021-04-30 设计创作,主要内容包括:本发明公开了一种多层分组的多维统计分析方法,包括下列步骤:S1、根据表格ID参数确定待统计的表格;S2、获取上述表格中用于分组和统计的表格数据;S3、根据转换器参数Transform,对表格数据进行转换,作为步骤S4的输入;S4、构造一个树节点,作为分组和统计的根节点;S5、从根节点出发,对当前节点数据按照指定的分组器参数的字段,对数据进行分组;S6、对每个分组构造一个树节点,作为当前节点的子节点,添加到树中;S7、通过上述节点的数据,得到基于多层分组的树结构表示的表格数据。有益效果:本发明是对表格数据进行多维度统计,实现灵活可扩展的统计分析功能,可用于多种统计分析应用中。(The invention discloses a multi-dimensional statistical analysis method for multilayer grouping, which comprises the following steps: s1, determining a table to be counted according to the table ID parameters; s2, obtaining the table data for grouping and statistics in the table; s3, converting the form data according to the converter parameter Transform as the input of the step S4; s4, constructing a tree node as a root node for grouping and statistics; s5, starting from the root node, grouping the data of the current node according to the field of the designated grouping device parameter; s6, constructing a tree node for each group, taking the tree node as a child node of the current node, and adding the tree node into the tree; and S7, obtaining table data expressed by a tree structure based on multi-layer grouping according to the data of the nodes. Has the advantages that: the invention carries out multi-dimensional statistics on the form data, realizes flexible and extensible statistical analysis function, and can be used in various statistical analysis applications.)
技术领域
本发明涉及数据分析领域,具体来说,涉及一种多层分组的多维统计分析方法。
背景技术
在数据科技时代,需要对海量数据进行分析,统计分析是一种简单有效的数据分析方式,能够帮助人们直观了解数据分布情况,从而快速产生结论或支持业务决策。
普通的统计分析工具仅仅只能够根据不同类型图表,分别进行参数设计和处理流程设计。
因此,数据分析业务需要一种灵活的、统一的统计分析方法。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
本发明的目的在于提供一种多层分组的多维统计分析方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种多层分组的多维统计分析方法,包括下列步骤:
S1、根据表格ID参数确定待统计的表格;
S2、获取上述表格中用于分组和统计的表格数据;
S3、根据转换器参数Transform,对表格数据进行转换,作为步骤S4的输入;
S4、构造一个树节点,作为分组和统计的根节点;
S5、从根节点出发,对当前节点数据按照指定的分组器参数的字段,对数据进行分组;
S6、对每个分组构造一个树节点,作为当前节点的子节点,添加到树中;
S7、通过上述节点的数据,得到基于多层分组的树结构表示的表格数据;
S8、对每个叶子节点分组,根据统计器参数中指定的统计函数,对当前分组数据进行统计计算;
S9、将整个树结构作为结果输出。
进一步的,所述步骤S2中获取上述表格中用于分组和统计的表格数据包括以下步骤:
S21、根据过滤器参数Query构造查询语句,从表格中进行数据过滤;
S22、通过上述过滤的数据,获取用于分组和统计的表格数据。
进一步的,所述步骤S7中通过上述节点的数据,得到基于多层分组的树结构表示的表格数据包括以下步骤:
S71、对每个节点的数据,按照节点所在层次,根据指定的分组器参数的字段,对数据进行分组;
S72、然后进入步骤S6,直到完成全部分组,形成基于多层分组的树结构表示的表格数据。
进一步的,所述步骤S8中,对每个叶子节点分组,根据统计器参数中指定的统计函数,对当前分组数据进行统计计算时,计算结果保存在所在叶子节点上。
进一步的,所述步骤S9中将整个树结构作为结果输出,其中输出结果中对于每个节点,移除节点的分组数据,仅保留分组后的分组标识id,用于下一层分组的字段名key和下一层分组结果data;
对于根节点,其id为空;
对于叶子节点,其key为空,且data表示统计计算结果。
与现有技术相比,本发明具有以下有益效果:本发明是对表格数据进行多维度统计,用户可指定表格数据,指定图表类型和图表参数作为输入,统计分析结果作为输出。该方法对二维表格数据进行统计分析,以一种多层级树形结构对统计结果进行统一表示,实现灵活可扩展的统计分析功能,可用于多种统计分析应用中。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种多层分组的多维统计分析方法的流程图之一;
图2是根据本发明实施例的一种多层分组的多维统计分析方法的流程图之二;
图3是根据本发明实施例的一种多层分组的多维统计分析方法设计参数的说明表格;
图4是根据本发明实施例的一种多层分组的多维统计分析方法步骤S9的输出数据结构表格;
图5是根据本发明一种多层分组的多维统计分析方法实施例的一组具有3列5行的表格数据实例表。
具体实施方式
在对本发明进一步描述之前,先简要对发明中提到的术语进行说明,如下:
表格数据
一种结构化数据的表示形式,常见的数据库表、Excel表单、CSV表单均可以作为表格数据进行处理。一张表格具有表名、表头和表行数据,其中表头定义了表的数据结构,表行数据是一组符合表头定义的数据实例的集合。
统计分析
对一组数据实例进行统计计算、获得概要信息的过程。常见的统计计算有:计数、求和、最大、最小、平均、方差等。
过滤器
用于对表行数据进行过滤筛选的规则函数。过滤器的输入是行数据,输出为布尔值。
转换器
用于对表行数据进行转换的函数。转换器的输入是行数据,输出为另一行数据。
分组器
用于对表行数据进行分组的函数。分组器的输入是一组行数据,输出为若干分组,每个分组为输入数据的子集,分组之间没有交集,且所有分组的并集与输入相同。
统计器
用于对一组行数据进行统计计算的函数。统计器的输入是一组行数据,输出为统计值。
下面,结合附图以及具体实施方式,对发明做出进一步的描述:.
请参阅图1-2,根据本发明实施例的一种多层分组的多维统计分析方法,包括下列步骤:
步骤S1、根据表格ID参数确定待统计的表格;
步骤S2、获取上述表格中用于分组和统计的表格数据;
S21、根据过滤器参数Query构造查询语句,从表格中进行数据过滤;
S22、获取用于分组和统计的表格数据
步骤S3、根据转换器参数Transform,对表格数据进行转换,作为下一步骤的输入
步骤S4、构造一个树节点,作为分组和统计的根节点
步骤S5、从根节点出发,对当前节点数据按照指定的分组器参数的字段,对数据进行分组
步骤S6、对每个分组构造一个树节点,作为当前节点的子节点,添加到树中
步骤S7、通过上述节点的数据,得到基于多层分组的树结构表示的表格数据;
S71、对每个节点的数据,按照节点所在层次,根据指定的分组器参数的字段,对数据进行分组;
S72、然后进入第六步,直到完成全部分组,形成基于多层分组的树结构表示的表格数据
步骤S8、对每个叶子节点分组,根据统计器参数中指定的统计函数,对当前分组数据进行统计计算,计算结果保存在所在叶子节点上。
步骤S9、将整个树结构作为结果输出。
输出结果中对于每个节点,移除节点的分组数据,仅保留分组后的分组标识id、用于下一层分组的字段名key和下一层分组结果data。对于根节点,其id为空;对于叶子节点,其key为空,且data表示统计计算结果。
本发明的多层,体现在是利用树结构进行逐层分组。本发明的多维,体现在对于叶子节点,可以从多个维度进行统计分析。
为了方便理解本发明的上述技术方案,以下就本发明在实际过程中的工作原理或者操作方式进行详细说明。
在实际应用时,上述步骤中的参数设计如图3所示,针对图3中的参数设计复杂数据结构进行解释如下:
Filter数据结构定义:
Filter:={//JSON对象结构
(field:Match)*
}
field:=<数据字段名>
Match:=value|List[Match]|Operator
Operator:=SimpleOper|ComplexOper
SimpleOper:={sop:value}
ComplexOper:={cop:List[Operator]}
sop:="$lt"|"$gt"|"$eq"|"$lte"|"$gte"|"$regex"
cop:="$and"|"$or"|"$not"
value:=string-value|number-value
string-value:=<JSON字符串>
number-value:=<JSON数字>
Transform数据结构定义:
Transform:={
field:<待转换的字段>,
transform:<转换函数>,
outputField:<输出字段>
支持以下转换函数:
针对日期类型
YEAR年份
MONTH月份
DAY日
HOUR小时
MINUTE分数
针对字符串类型
UPPER大写
LOWER小写
LENGTH获取长度
CAPITAL单次首字母大写
针对数字类型
ROUND向上取整
FLOOR6
CEILING
ABS求绝对值
NEG求相反值
SQURE求平方值
SQRT求平方根值
Group 数据结构定义:
支持以下统计函数:
针对所有类型
COUNT简单计数返回分组的行数
DIFF唯一计数返回不同值的数目
数值类型
SUM求和
MIN最小值
MAX最大值
AVG平均
MEDIAN中位数
VAR方差
STD标准差
Sort数据结构定义:
另外,如图5所示,在一个实施例中,产生了如图5所示的3列5行的表格数据,对示例数据按照X1、X2分组,然后统计每个分组的数据条数,则统计结果如下(JSON表示):
综上所述:本发明是对表格数据进行多维度统计,用户可指定表格数据,指定图表类型和图表参数作为输入,统计分析结果作为输出。该方法对二维表格数据进行统计分析,以一种多层级树形结构对统计结果进行统一表示,实现灵活可扩展的统计分析功能,可用于多种统计分析应用中。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
- 上一篇:一种医用注射器针头装配设备
- 下一篇:智能文档处理方法、系统、计算机设备及介质