一种基于改进的模糊c均值聚类方法的体育成绩预测方法

文档序号:35631 发布日期:2021-09-24 浏览:9次 >En<

阅读说明:本技术 一种基于改进的模糊c均值聚类方法的体育成绩预测方法 (Sports score prediction method based on improved fuzzy C-means clustering method ) 是由 田磊 周近 蓝晓萍 张思维 于 2021-06-02 设计创作,主要内容包括:一种基于改进的模糊C均值聚类方法的体育成绩预测方法。步骤1,获取训练样本:采集学生的各项项目的成绩和人工评定的成绩,并根据相关标准确定各项项目的得分,其中测试项目包含:50米跑、坐位体前屈、立定跳远、引体向上(男)、仰卧起坐(女)、1000米跑(男)、800米跑(女);步骤2,映射编码处理:将采集到的各项项目成绩进行映射编码,而后将各项成绩拼接组成特征向量;步骤3,模型离线训练:利用训练样本组成的特征向量对改进的模糊C均值聚类方法进行训练,确定各分数段的聚类中心;步骤4,模型在线打分:利用训练好的模型在线对学生成绩进行预测,并将分数实时输出。本发明可以准确的预测学生的体育成绩,具有良好的实际应用价值。(A sports result prediction method based on an improved fuzzy C-means clustering method. Step 1, obtaining a training sample: collecting the achievements of all items of students and the achievements of manual evaluation, and determining the scores of all items according to relevant standards, wherein the test items comprise: running at 50 m, bending forward, standing long jump, pulling up (male), sit-up (female), running at 1000 m (male), running at 800 m (female); step 2, mapping coding treatment: mapping and coding the acquired scores of each item, and splicing the scores to form a feature vector; step 3, off-line training of the model: training the improved fuzzy C-means clustering method by using a feature vector formed by training samples, and determining the clustering center of each fractional segment; step 4, online scoring of the model: and (4) predicting the student score on line by using the trained model, and outputting the score in real time. The invention can accurately predict the sports scores of students and has good practical application value.)

一种基于改进的模糊C均值聚类方法的体育成绩预测方法

技术领域

本发明涉及学生体育成绩预测领域,特别是涉及一种基于改进的模糊C均值聚类方法的体育成绩预测方法。

背景技术

当前我国经济处于高速发展阶段,高校学生更重视物质生活,轻视身体锻炼,导致身体素质急剧下降,而体育成绩课是提升高校学生身体素质的主要途径。通过预测高校学生体育成绩,可辅助体育管理部门开设合理的体育成绩课程;还可帮助体育教师改善教学方式,制定科学合理的教育训练机制,提高高校学生身体素质。

针对体育成绩预测问题,许多学者进行了大量的研究,当前主要有两类:线性体育成绩预测方法和非线性体育成绩预测预测方法,线性建模方法主要有多元线性回归,但是只能对体育成绩的线性变化特点进行描述,导致体育成绩预测误差比较大;非线性建模方法主要有人工神经网络,人工神经网络虽然有较强的非线性建模能力,但是其易出现过拟合的体育成绩预测结果,使得体育成绩预测结果不可信。

国内涉及成绩预测的专利有“一种基于深度学习的学生成绩预测系统及其方法”(202010961528.0),该专利包括数据管理模组和模型运作模组,所述数据管理模组包括用户信息模块和成绩信息模块,用户信息模块用以实现用户注册、用户登录和用户信息修改的功能,利用了深度学习算法来处理复杂的非线性数据,从而提高预测方法的准确率,但该专利中所述的深度学习模型的泛化性可能不足。国家发明专利“评估和预测体育成绩的混合方法”(201880087060.8),该专利所述的系统包括接收器,其收集关于体育成绩的一个或多个方面的不确定性数据;体育成绩的确定性模型;混合处理器,其根据这些元素创建条件概率模型;以及显示器,其呈现评价或预测的成绩,但该专利的体育成绩预测考虑的因素不够多,导致预测精度得不到保证。

发明内容

为解决上述问题,本发明在模糊C均值聚类算法的基础上,提出了一种基于改进的模糊C均值聚类方法的体育成绩预测方法。为尽可能突出各项项目的测试成绩,提出了一种映射编码处理准则;同时,对模糊聚类中的欧氏距离进行了重新定义,可以更加准确有效的量化样本点与聚类中心的距离;最后,通过对不同聚类中心和改进的欧式距离的研究,提出了新的成绩预测的计算公式。为达此目的,本发明提供一种基于改进的模糊C均值聚类方法的体育成绩预测方法,具体步骤如下,其特征在于:

步骤1,获取训练样本:采集学生的各项项目的成绩和人工评定的成绩,并根据相关标准确定各项项目的得分;

步骤2,映射编码处理:将采集到的各项项目成绩进行映射编码,而后将各项成绩拼接组成特征向量;

步骤2中的成绩的编码处理准则可表述如下:

式中,x表示需要编码的成绩,xc表示编码后的成绩,xmin和xmax分别是所有样本数据同一项目对应的最小值和最大值;

步骤3,模型离线训练:利用训练样本组成的特征向量对改进的模糊C均值聚类方法进行训练,确定各分数段的聚类中心;

步骤3中对改进的模糊C均值聚类方法进行训练的具体步骤为:

步骤3.1,定义代价函数J,对样本集X={x1,x2,x3,...,xN},其中x1={u11,u12,...,u1n},模糊组的数量c设定为10,J用于对每组的聚类中心vi(i=1,2,...,c)的求解,其定义为每组数据与聚类中心vi中心距离的平方和,具体的表达式如下:

式中,U={uij}表示隶属度矩阵,V={vi}表示聚类中心矩阵,m为模糊系数,本专利选择为2,dij表示样本xi与聚类中心cj之间的改进的欧式距离,本专利将其重新进行定义,表达式如下:

式中,uik表示ui的第k个特征量,vik表示vi的第k个特征量,sk表示第k个分量的标准差。

步骤3.2,设定迭代终止的阈值ε和隶属度矩阵U;

步骤3.3,构建拉格朗日函数,并更新各聚类中心,更新的准则为:

步骤3.4,更新隶属度矩阵,更新的准则为:

步骤3.5,判断相邻的隶属度矩阵之间的误差是否满足迭代终止阈值ε,若满足,则停止迭代,反之跳转至步骤3.4继续迭代;

步骤4,模型在线打分:利用训练好的模型在线对学生成绩进行预测,并将分数实时输出。

作为本发明进一步改进,步骤4中在线对学生成绩进行预测的具体步骤为:

步骤4.1,确定每个聚类中心对应的分数段,其中10个聚类中心对应的分数段分别为0~10、11~20、21~30、31~40、41~50、51~60、61~70、71~80、81~90和91~100,每个聚类中心的基础值bj,j=1,2,...,c分别为0、10、20、30、40、50、60、70、80和90;

步骤4.2,计算每个聚类中心的最大的改进的欧式距离

步骤4.3,确定在线输入数据所属的类别以及对应的改进的欧式距离dj

步骤4.4,确定最终的预测得分s,计算公式如下:

本发明一种基于改进的模糊C均值聚类方法的体育成绩预测方法,有益效果:本发明的技术效果在于:

1.本发明提出了一种映射编码处理准则,可能更好的突出各项项目的测试成绩;

2.本发明对模糊聚类中的欧氏距离进行了重新定义,提出了一种改进的模糊C均值聚类算法,可以更加准确有效的确定不同分数段对应的聚类中心;

3.本发明通过对不同聚类中心和改进的欧式距离的研究,提出了新的成绩预测的计算公式,实现了对体育成绩精准的预测。

附图说明

图1为本发明的流程图;

图2为本发明所述的改进的模糊C均值聚类算法流程图。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细描述:

本发明提出了一种基于改进的模糊C均值聚类方法的体育成绩预测方法,旨在实现对学生体育成绩准确有效的预测。图1为本发明的流程图,下面结合流程图对本发明的步骤作详细介绍。

步骤1,获取训练样本:采集学生的各项项目的成绩和人工评定的成绩,并根据《国家学生体质健康标准》确定各项项目的得分,其中测试项目包含:50米跑、坐位体前屈、立定跳远、引体向上(男)、仰卧起坐(女)、1000米跑(男)、800米跑(女);

步骤2,映射编码处理:将采集到的各项项目成绩进行映射编码,而后将各项成绩拼接组成特征向量;

步骤2中的成绩的编码处理准则可表述如下:

式中,x表示需要编码的成绩,xc表示编码后的成绩,xmin和xmax分别是所有样本数据同一项目对应的最小值和最大值。

步骤3,模型离线训练:利用训练样本组成的特征向量对改进的模糊C均值聚类方法进行训练,确定各分数段的聚类中心;

步骤3中对改进的模糊C均值聚类方法进行训练的具体步骤为:

步骤3.1,定义代价函数J,对样本集X={x1,x2,x3,...,xN},其中x1={u11,u12,...,u1n},模糊组的数量c设定为10,J用于对每组的聚类中心vi(i=1,2,...,c)的求解,其定义为每组数据与聚类中心vi中心距离的平方和,具体的表达式如下:

式中,U={uij}表示隶属度矩阵,V={vi}表示聚类中心矩阵,m为模糊系数,本专利选择为2,dij表示样本xi与聚类中心cj之间的改进的欧式距离,本专利将其重新进行定义,表达式如下:

式中,uik表示ui的第k个特征量,vik表示vi的第k个特征量,sk表示第k个分量的标准差。

步骤3.2,设定迭代终止的阈值ε和隶属度矩阵U;

步骤3.3,构建拉格朗日函数,并更新各聚类中心,更新的准则为:

步骤3.4,更新隶属度矩阵,更新的准则为:

步骤3.5,判断相邻的隶属度矩阵之间的误差是否满足迭代终止阈值ε,若满足,则停止迭代,反之跳转至步骤3.4继续迭代。

步骤4,模型在线打分:利用训练好的模型在线对学生成绩进行预测,并将分数实时输出。

步骤4中在线对学生成绩进行预测的具体步骤为:

步骤4.1,确定每个聚类中心对应的分数段,其中10个聚类中心对应的分数段分别为0~10、11~20、21~30、31~40、41~50、51~60、61~70、71~80、81~90和91~100,每个聚类中心的基础值bj(j=1,2,...,c)分别为0、10、20、30、40、50、60、70、80和90;

步骤4.2,计算每个聚类中心的最大的改进的欧式距离

步骤4.3,确定在线输入数据所属的类别以及对应的改进的欧式距离dj

步骤4.4,确定最终的预测得分s,计算公式如下:

图2为本发明所述的改进的模糊C均值聚类算法流程图。从该流程图中可以清晰的看出改进的模糊C均值算法主要包括:首先定义代价函数J;接着初始化隶属矩阵U、迭代终止阈值、类别总数c;然后构建拉格朗日函数,对聚类中心V进行更新;同时更新代价函数J和隶属度矩阵U;而后判断当前状态是否满足迭代终止条件,若满足则终止,否则继续迭代;最后输出U、V,并确定相应的聚类中心。

以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种产流模式自适应的流域水文预报方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!