基于esg的企业评价执行装置及其运转方法

文档序号:1220298 发布日期:2020-09-04 浏览:6次 >En<

阅读说明:本技术 基于esg的企业评价执行装置及其运转方法 (ESG-based enterprise evaluation execution device and operation method thereof ) 是由 尹悳灿 德伊勒·瓦森达拉 林枝妍 谢尔盖·列克西科夫 于 2017-11-23 设计创作,主要内容包括:本发明公开了一种基于ESG的企业评价执行装置及其运转方法。本发明多样实施例的ESG企业评价装置从ESG(Environmnet,Social,Governance:环境、社会、治理)角度评价企业,算出分数,可以包括:新闻收集部,所述新闻收集部在互联网上收集多个新闻报导,按日期或按企业分类,通过所述新闻报导间的类似度分析,执行对类似度为基准值以上的新闻报导的分类归并;新闻分类部,所述新闻分类部将所述各个新闻报导分类为与环境、社会或治理结构中哪个话题相关;及评价结果导出部,所述评价结果导出部按群集单位,计算相应群集的ESG风险,以计算的值为基础,算出ESG企业评价分数。(The invention discloses an enterprise evaluation execution device based on an ESG and an operation method thereof. The ESG enterprise evaluation apparatus according to various embodiments of the present invention evaluates an enterprise from an ESG (environmental, Social, Governance) perspective, and calculates a score, which may include: a news collecting unit that collects a plurality of news reports on the internet, classifies the news reports by date or by enterprise, and performs classification and consolidation of news reports having a similarity of a reference value or more by similarity analysis among the news reports; a news classification section that classifies the individual news stories as being related to which topic in an environment, society, or governance structure; and an evaluation result deriving unit that calculates an ESG risk for each cluster, and calculates an ESG enterprise evaluation score based on the calculated value.)

基于ESG的企业评价执行装置及其运转方法

技术领域

本发明的多样实施例涉及基于ESG的企业评价执行装置及其运转方法,该技术涉及收集并分析互联网上的新闻报导,对与企业所拥有的环境、社会或治理结构话题相关的风险进行分析并评分的装置及其运转方法。

背景技术

最近,企业在对风险管理倾注更多精力的同时,多角度评价自己企业与其他企业,将这种评价结果应用于对投资、并购、生产线的风险管理等。

一般而言,企业一般以能够定量获得的财务性数据为基础来评价企业,但最近,以非财务性数据为基础来评价企业、分析风险的方法论悄然兴起。在企业公开的财务性数据中,虽然未反映不利于相应企业的内容,但企业提供的财务相关报告的可靠性也受到质疑。如果考查需要通过非财务数据进行企业分析的理由,随着人们通过互联网的SNS活动日益活跃,企业声誉可能因对企业或制品的特定传闻传播事件等而动摇,另外,由于企业主的犯罪或健康相关传闻,相应企业具有的风险可能因而升高,这种事件实际上是通过财务性数据难以分析的。因此,不仅是财务性数据,还通过非财务性数据来分析企业,从而能够更精密进行企业评价。

在这种潮流下,悄然兴起将非财务数据分成ESG(Environmnet、Social、Governance:环境、社会、治理)三个主题进行分析的方法论。

虽然出现了以诸如ESG的非财务数据为基础来制作对企业的评价报告的企业,但非财务数据由于主观性质强、报告制作速度也相对缓慢,存在企业难以对此进行利用的缺点。为了改善这种缺点,就计算机程序等在互联网上收集ESG相关新闻报导并自动分析、执行企业评价而言,新闻报导由于并非规范性数据,在使新闻报导的分类和评价实现自动化的过程存在许多困难。

发明内容

本发明的多样实施例正是为了解决如上所述问题而研发的,目的在于收集互联网上的新闻报导,以此为基础,基于ESG执行对企业的评价。

本发明另一目的在于,通过所收集新闻报导间的类似度分析,分类归并对相同事件的新闻报导。

本发明又一目的在于,使得执行ESG企业评价的装置采用机器学习算法而执行学习,从而提高对所收集的新闻进行分类的性能。

本发明要解决的课题不限于以上提及的课题,未提及的其他课题是普通技术人员可以从以下记载理解的。

(解决问题的手段)

为了达成如上所述目的,本发明的一个实施例提供一种ESG企业评价装置,所述ESG企业评价装置从ESG(Environmnet,Social,Governance:环境、社会、治理)角度评价企业,算出分数,包括:新闻收集部,所述新闻收集部在互联网上收集多个新闻报导,按日期或按企业分类,通过所述新闻报导间的类似度分析,执行对类似度为基准值以上的新闻报导的分类归并;新闻分类部,所述新闻分类部将所述各个新闻报导分类为与环境、社会或治理结构中哪个话题相关;及评价结果导出部,所述评价结果导出部按群集单位,计算相应群集的ESG风险,以计算的值为基础,算出ESG企业评价分数。

所述新闻收集部可以利用与所述新闻报导制作语言相应的语素分析器执行语素分析,以语素分析结果为基础,执行对所述各个新闻报导的矢量化,所述类似度分析可以通过对所述各个新闻报导的余弦类似度分析来执行。

所述新闻收集部在通过语素分析结果来执行对所述各个新闻报导的矢量化方面,可以利用TF-IDF(Term Frequency-Inverse Document Frequency:词频-逆文档频率)值。

所述新闻分类部在将所述各个新闻报导分类为与环境、社会或治理结构中哪个话题相关之前,可以先以真假方式对所述新闻报导是否与环境、社会或治理结构中至少一者相关进行分类。

所述新闻分类部在将所述各个新闻报导分类为与环境、社会或治理结构中某个话题相关后,可以将各个所述话题分成细化目录,将所述各个新闻报导分类到所述目录。

所述新闻分类部将在所述各个新闻报导分类为与环境、社会或治理结构中哪个话题相关之前,可以采用特定机器学习算法,通过练习用数据执行学习,提高分类能力。

所述新闻分类部采纳的机器学习算法可以为多项式贝叶斯(MultinomialBayes)、伯努利贝叶斯(Bernoulli Bayes)、SGD(Stochastic Gradient Descend:随机梯度下降)、线性支持向量分类器(Linear SVC)、感知器(Perceptron)或随机森林(RandomForest)中某一种。

所述评价结果导出部可以执行对从所述新闻报导提取的名词的分类,以各目录项目包含的单词的频度数为基础,按群集单位执行对所述目录项目的顺序设置或证据级别算出。

所述评价结果导出部可以以算出的证据级别值为基础,计算各群集属于环境、社会或治理结构的话题的几率。

所述评价结果导出部在算出所述ESG企业评价分数方面,可以利用算出的证据级别值及各群集属于环境、社会或治理结构的几率。

为了达成如上所述目的,本发明另一实施例提供一种ESG企业评价装置的分数算出方法,作为ESG企业评价装置从ESG(Environmnet,Social,Governance:环境、社会、治理)角度评价企业、算出分数的方法,包括:在互联网上收集多个新闻报导,按日期或按企业分类,通过所述新闻报导间的类似度分析,执行对类似度为基准值以上的新闻报导的分类归并的步骤;将所述各个新闻报导分类为与环境、社会或治理结构中哪个话题相关的步骤;及按群集单位,计算相应群集的ESG风险,以此为基础,算出ESG企业评价分数的步骤。

发明效果

根据本发明一个实施例,ESG企业评价实现自动化而执行,从而可以提高ESG企业评价导出的速度。

根据本发明另一实施例,可以提供一种借助于机器学习而持续提高对新闻报导进行分类的性能的企业评价装置。

根据本发明又一实施例,可以对以多样种类语言制作的新闻报导执行分析,并以此为基础来评价企业。

本发明的效果不限制于以上提及的效果,未提及的其他效果是普通技术人员可以从以下记载而明确理解的。

附图说明

图1是概略地显示本发明一个实施例的执行ESG企业评价的流程的概念图。

图2是概略地显示本发明一个实施例的EGS企业评价模块的构成的框图。

图3是用于说明证据级别算出部对从新闻报导提取的名词进行分类的方法的图表。

图4是用于说明证据级别算出部以目录项目中包含的单词的个数为基础,设置项目的顺序并进行正规化,以正规化的数值为基础,算出证据等级的方法的图表。

图5是显示本发明一个实施例的ESG几率算出部执行对各群集的ESG几率算出的结果的图表。

图6是概略地显示本发明一个实施例的ESG企业评价装置从收集新闻报导的过程导出ESG企业评价分数的过程的框图。

具体实施方式

本说明书中使用的术语用于说明实施例,并非要限制本发明。在本说明书中,只要在语句中未特别提及,单数型也包括复数型。说明书中使用的“包括(comprises)”及/或“包括的(comprising)”,不排除在提及的构成要素之外存在或添加一个以上的其他构成要素。在通篇说明书中,相同的附图标记指称相同的构成要素,“及/或”包括提及的构成要素的每个或一个以上的所有组合。虽然为了叙述多样构成要素而使用了“第一”“第二”等,但这些构成要素当然不由这些术语所限定。这些术语只用于将一个构成要素区别于其他构成要素。因此,下面言及的第一构成要素在本发明技术思想内,当然也可以是第二构成要素。

在通篇说明书中,当提到某部分“包括”某构成要素时,只要没有特别反对的记载,则不排除其他构成要素,意味着可以还包括其他构成要素。另外,说明书中记载的“…部”“模块”等术语,意味着至少处理一种功能或动作的单位,其可以以硬件或软件体现,或以硬件与软件的结合来体现。

图1是概略地显示本发明一个实施例的执行ESG企业评价的流程的概念图。

本发明公开的ESG企业评价,可以借助于以计算机软件形态体现的程序实现自动化而执行。即,图1中示例性图示的各个方法,可以借助于执行ESG企业评价的ESG企业评价装置100搭载的软件进行运算处理而执行。

如果参照图1,ESG企业评价装置100可以通过三个步骤算出最终企业评价结果。如果考查图1的(a),ESG企业评价装置100可以先从互联网上收集作为执行企业评价的基本资料的新闻报导。ESG企业评价装置100在收集新闻报导方面,通过语素分析及文档间类似度计算等,判断新闻是否关于哪个企业、关于哪个主题等,可以第一次执行类似的报导之间进行分类的分类归并。

如果参照图1的(b),ESG企业评价装置100以收集并第一次分类归并的新闻报导为基础,可以执行更精密的新闻报导分类操作。ESG企业评价装置100在执行新闻报导分类操作方面,先判断收集的新闻是否与ESG相关,即,是否与环境、社会或治理结构中至少某一者相关,然后判断收集的新闻与环境、社会、治理结构中哪个主题相关并分类。最终,ESG企业评价装置100可以针对分类为环境、社会、治理结构的三种主题的各个新闻报导,执行更细致的目录分类。

如果参照图1的(c),ESG企业评价装置100以分类的新闻报导为基础,导出最终的企业评价分数。在该过程中,ESG企业评价装置100可以按群集单位,对新闻报导包括的主要单词算出证据级别,算出新闻报导属于环境、社会、治理结构中哪个的几率等。

为了便于说明,图示本发明的ESG企业评价装置100经过三个步骤,导出最终ESG企业评价分数的情形并进行说明,这种步骤当然可以分割或统合,以更少或更多数量的步骤体现。

图2是概略地显示本发明一个实施例的EGS企业评价模块100的构成的框图。

如果参照图2,ESG企业评价装置100可以包括控制部110、新闻收集部120、新闻分类部130、评价结果导出部140、通信部150及存储部160构成。另外,新闻收集部120可以包括语素分析部121、企业及日期分类部122以及新闻分类归并部123,新闻分类部130可以包括二元分类部131、ESG分类部132及目录分类部133,评价结果导出部140可以包括证据级别算出部141、ESG几率算出部142及分数算出部143。

为了说明的便利,将在ESG企业评价装置100内执行各个作用的主体显示为~部的形态,但各个部分可以是在ESG企业评价装置100内运转的子程序模块。这种程序模块是总括执行各动作或运行特定抽象数据类型的例行程序、子程序、程序、对象、组件、数据结构等的概念,但不限于此。

一个实施例的控制部110可以执行控制新闻收集部120、语素分析部121、企业及日期分类部122、新闻分类归并部123、新闻分类部133、二元分类部131、ESG分类部132、目录分类部133、评价结果导出部140、证据等级算出部141、ESG几率算出部142、分数算出部143、通信部150及存储部160间的数据流动的功能。即,本发明的控制部110可以控制使得新闻收集部120、语素分析部121、企业及日期分类部122、新闻分类归并部123、新闻分类部133、二元分类部131、ESG分类部132、目录分类部133、评价结果导出部140、证据等级算出部141、ESG几率算出部142、分数算出部143、通信部150及存储部160执行各自固有功能。

一个实施例的新闻收集部120如前所述,可以包括语素分析部121、企业及日期分类部122以及新闻分类归并部123。ESG企业评价装置100为了执行企业评价,需要在互联网上发生的众多新闻报导中,只收集与企业的环境、社会或治理结构相关的新闻报导,只有从可信的出处获得新闻,才能够不生成因虚假新闻等导致的错误评价。新闻收集部120可以设置周期性时间间隔,收集在互联网上更新的新闻报导,在收集新闻报导方面,可以一同收集各个新闻报导发行的日期信息、发行相应新闻的舆论媒体信息等。新闻收集部120的新闻报导收集可以通过ESG企业评价装置100内的通信部150实现。

语素分析部121可以按照作为具有意义的最小单位的语素单位,对收集的新闻报导的整个文本进行分析。一个实施例的语素分析部121分析以韩语制作的新闻报导时,可以选择多样的韩语语素分析器之一,通过其执行分析。根据一个实施例,作为韩语语素分析器,存在kiwi、HAM、HLX、Mecab等多样种类,语素分析部121可以利用其中之一执行语素分析,并利用其结果。根据另一实施例,语素分析部121在分析并非韩语而由其他语言制作的新闻方面,可以利用与相应语言相应的语素分析器来执行语素分析。

企业及日期分类部122可以将收集的新闻报导按企业及按日期分类。企业及日期分类部122可以利用由企业名构建成数据库形态的企业字典,判断特定报导是关于哪家企业的报导。企业及日期分类部122判断特定报导是关于哪家企业的报导后,可以确认相应报导发行的日期,按期间整理新闻报导。根据一个实施例,企业及日期分类部122在按企业将新闻报导分类后,可以将涉及相同企业的新闻按一周期间或一个月期间分类。这种按期间分类可以用于ESG企业评价装置100在稍后执行企业评价时,以最新新闻报导具有加权值的方式进行计算。

新闻分类归并部123可以将收集的新闻报导中涉及相同话题的相关新闻构成为一个群集。新闻分类归并部123为了确认多个新闻报导是否是涉及同一话题的相关新闻,可以计算新闻报导间的类似度。

根据一个实施例,新闻分类归并部123计算新闻报导间类似度的方式,可以是将各文档矢量化后,通过计算各矢量间的余弦类似度。

新闻分类归并部123可以利用TF-IDF(Term Frequency–Inverse DocumentFrequency:词频-逆文档频率)来使各新闻报导矢量化。TF(Term Frequency)作为显示特定单词在文书中登场的频度数的值,该值越高,可以认为相应单词在文书中越重要。可以将特定单词在收集的多个新闻报导中登场的频度数表示为DF(Document Frequency:文档频度),该值的倒数为IDF(Inverse Document Frequency:逆文档频率)。特定单词如果在多个新闻报导之间频繁登场,则该单词成为老套的单词,在新闻报导中无法成为核心的单词,因而使用IDF而非DF。TF-IDF定义为将TF与IDF相乘的值,本发明一个实施例的新闻分类归并部123计算新闻报导的TF-IDF的方式,可以使用数学式1。

[数学式1]

Figure BDA0002576637450000071

在所述数学式1中,tfi.j代表单词i在新闻报导j中登场的频度,dfi代表在由新闻报导构成的集中包含单词i的新闻报导的数量。

新闻分类归并部123可以以所述数学式1为基础,对各个新闻报导进行矢量化,可以以各个新闻报导的矢量值为基础,计算新闻报导间的类似度。

[数学式2]

根据一个实施例,新闻分类归并部123可以通过所述数学式2,计算新闻报导间的类似度。在数学式2中,A与B分别为矢量,Ai与Bi分别指A与B矢量中的第i成分。新闻报导间的余弦类似度计算为0至1之间的数字,0是指新闻报导彼此独立的情形,1是指新闻报导彼此完全相同的情形。

新闻分类归并部123可以在计算新闻报导间的类似度后,以事先通过实验设置的基准值为基础,判断新闻报导是否类似,可以将判断为类似的新闻报导捆绑成一个群集。在以下说明中,所谓“群集”,是指由新闻分类归并部123判断为类似新闻的新闻报导的集合。

一个实施例的新闻分类部130如前所述,可以包括二元分类部131、ESG分类部132及目录分类部133。新闻分类部130可以根据三种基准,将新闻收集部120收集的新闻报导分类。新闻分类部130可以通过二元分类部131,将新闻报导第一次分类,然后,通过ESG分类部132进行分类,最终通过目录分类部133进行分类。在该过程中,新闻报导可以按更细致的基准分类。

二元分类部131可以判断所收集的各个新闻报导是否与ESG相关,以真假(True orfalse)方式分类。即,二元分类部131在判断所收集的新闻是否为能够用于ESG企业评价的数据方面,如果判断为与环境、社会、治理结构中至少一者相关,则可以分类为真(TRUE),否则分类为假(FALSE)。因此,二元分类部131将诸如体育、演艺、政治、艺术等那样在ESG企业评价中不需要的新闻报导分类为FALSE,从而可以使ESG企业评价装置100需处理的新闻报导的量大幅减少。

根据一个实施例,ESG分类部132可以将二元分类部131分类为真(TRUE)的新闻报导,分类成环境、社会、治理结构的三个话题。然后,分类的新闻报导可以借助于目录分类部133而分类为更细化的目录。即,环境、社会、治理结构的话题分别分类为更细致的下级目录,一个新闻报导借助于目录分类部130而隶属于下级目录中某一者。

根据一个实施例,二元分类部131、ESG分类部132及目录分类部133可以利用机器学习算法,执行新闻报导的分类。

如果考查二元分类部131、ESG分类部132及目录分类部133利用机器学习算法来执行分类的方式,首先,可以通过自然语言分析,从新闻报导中只提取名词。根据一个实施例,对于二元分类部131、ESG分类部132及目录分类部133在由韩语构成的新闻报导中只提取名词,可以使用作为自然语言分析包的种类之一的KoNLP。根据另一实施例,二元分类部131、ESG分类部132及目录分类部133为了在以不同语言构成的新闻报导中提取名词,可以使用与相应语言相符的分析工具。

二元分类部131、ESG分类部132及目录分类部133在新闻报导中只提取名词后,可以通过数学式1,利用前述TF-IDF生成矩阵。利用TF-IDF而生成的矩阵,可以按照借助于新闻分类归并部123而分类的群集来生成。根据一个实施例,在生成的矩阵中,可以在行中罗列各个新闻报导中包含的单词(名词),在列中针对各个单词(名词)罗列包含相应单词的新闻报导。

二元分类部131、ESG分类部132及目录分类部133然后可以以利用TF-IDF生成的矩阵为基础,通过机器学习算法,执行与各个分类部的作用相符的分类。根据一个实施例,二元分类部131、ESG分类部132及目录分类部133采用特定机器学习算法后,接受输入使用者预先分类好的练习用数据而进行学习,因而可以提高分类能力。然后,可以向通过练习用数据而进行既定程度学习后的二元分类部131、ESG分类部132及目录分类部133输入测试数据,通过了测试的各分类部可以通过相应学习算法,执行新闻报导的分类。

根据一个实施例,二元分类部131、ESG分类部132及目录分类部133可以选择并采用多项式贝叶斯(Multinomial Bayes)、伯努利贝叶斯(Bernoulli Bayes)、SGD(Stochastic Gradient Descend:随机梯度下降)、线性支持向量分类器(Linear SVC)、感知器(Perceptron)、随机森林(Random Forest)等机器学习算法之一。

一个实施例的评价结果导出部140可以以借助于新闻收集部120而收集并借助于新闻分类部130而按目录分类的新闻报导为基础,执行ESG企业评价。即,评价结果导出部140可以以ESG相关报导为基础,按企业执行赋分,通过分数执行企业评价。如前所述,评价结果导出部140可以包括证据级别算出部141、ESG几率算出部142及分数算出部143。

证据级别算出部141可以将从新闻报导中提取的名词分类为多个单词目录。根据一个实施例,证据级别算出部141可以将名词分类为环境损害(Environment Damage,D_Env)、社会利害关系人(Company Stakeholder,S_Company)、普通损害(General Dagmae,D_gen)等。

图3是用于说明证据级别算出部141对从新闻报导中提取的名词进行分类的方法的图表。

如果参照图3,证据级别算出部141可以判断所提取的名词与ESG中哪个项目相应、在相应项目中与哪些要素相关,并最终执行分类。这种名词的分类可以与前述目录分类部133执行的分类不同。即,目录分类部133执行的分类是将各新闻报导分类为比环境、社会、治理结构的话题更细致的下级目录,证据级别算出部141执行的分类可以是对从新闻报导中提取的名词的分类。即,目录分类部133执行对各个新闻报导的分类,证据级别算出部141执行对名词的分类,属于目录的个体分别作为新闻报导和名词,两者不同。

根据一个实施例,证据级别算出部141执行如上所述的分类后,可以按照借助于新闻分类归并部123而分类的作为新闻报导集合的群集,计算各目录项目包含几个单词。这种单词如图3所示,可以是借助于证据级别算出部141而提取并完成分类的名词。

证据级别算出部141可以以目录项目包含的单词的个数为基础,设置各目录项目的顺序,可以对单词个数进行正规化,以正规化的数值为基础,算出各目录项目的证据等级。

图4是用于说明证据级别算出部141以目录项目包含的单词的个数为基础,设置项目的顺序并进行正规化,以正规化的数值为基础,算出证据等级的方法的图表。

如果参照图4,可以针对一个群集,按各个目录标识出包含了几个单词、包含了哪些单词,以包含的单词的个数为基础,设置了各目录的顺序。另外,将各目录包含的单词的个数显示为正规化的数值,以这种正规化数值为基础,显示出证据等级。证据级别算出部141可以将正规化的数值,根据既定的基准值,按区间进行分类而算出证据等级。

ESG几率算出部142可以以证据级别算出部141使用的目录项目为基础,算出作为类似新闻集合的各群集属于环境、社会或治理结构中某一话题的几率。

ESG几率算出部142在算出各群集属于ESG中某一话题的几率前,可以将证据级别算出部141使用的目录项目正规化为更少数量的集合。根据一个实施例,这些集合可以分类为环境、社会、治理结构、企业风险及其他相关问题。

[数学式3]

ESG几率算出部142可以利用所述数学式3,算出特定群集的环境、社会或治理结构话题的证据等级。以ESG几率算出部142算出环境的证据等级的方法为例,在数学式3中,Ci是指关于环境的目录中第i目录,n是指环境相关目录的个数,E(Ci-)作为关于环境的第i目录的证据等级,是指证据级别算出部141如前所述算出的。即,证据级别算出部141算出的证据等级是关于在对提取的名词进行分类时利用的目录的证据等级,ESG几率算出部142算出的证据等级是关于环境、社会、治理结构的三种话题的证据等级。

ESG几率算出部142可以算出各群集与环境、社会、治理结构三个种类中某一种相关的几率。

[数学式4]

Figure BDA0002576637450000112

ESG几率算出部142可以利用所述数学式4,算出各群集的ESG几率。

图5是显示本发明一个实施例的ESG几率算出部142执行对各群集的ESG几率算出的结果的图表。

如果参照图5,针对多个群集,显示出关于环境、社会、治理结构三种话题的证据等级及其ESG几率。可以确认,将特定群集与环境、社会、治理结构话题中哪个相关的几率全部相加则为1。

一个实施例的分数算出部143在作为ESG企业评价最终步骤的计算ESG企业评价分数之前,可以在计算各种辅助指标后,利用计算的辅助指标,计算ESG企业评价分数。如上所述的辅助指标及ESG企业评价分数可以通过如前所述计算的证据等级及ESG几率来计算。

根据一个实施例,各种辅助指标可以由ESG风险分数、企业风险分数及关联性分数等构成。这些辅助指标并非限定于如上所述三个种类,可以定义为多样的数量和计算方式。

[数学式5]

Figure BDA0002576637450000121

根据一个实施例,分数算出部143最终可以以如上述数学式5所示的方式算出ESG企业评价分数。在数学式5中,ESGrisk、CompanyRisk、Relevance代表各种辅助指标。在数学式5中,ESGrisk、CompanyRisk、Relevance代表各种辅助指标。ESGrisk可以是分类为特定群集的新闻报导的集合就环境、社会、企业结构而分别计算具有多大程度的危险性后合算的值,CompanyRisk可以是与ESG几率算出部142规定的集合中企业风险相关集合和分类为相应集合的单词目录相关的值,Relevance可以是与ESG几率算出部142规定的集合中分类为其他的集合和分类相应集合的单词目录相关的值。

一个实施例的通信部150使得能够实现ESG企业评价装置100与外部装置间的通信。具体而言,使得ESG企业评价装置100可以与相应装置的用户终端通信,使得可以通过互联网连接,收集新闻收集部120发行的新闻。

一个实施例的存储部160可以存储ESG企业评价装置100运转所需的数据。存储部160可以将收集的新闻报导、对新闻报导的分类信息、赋分信息、机器学习算法的学习历史等以数据形式保管。

通过如前所述的方式,ESG企业评价装置100可以最终按照作为类似报导集合的各群集而导出ESG企业评价分数。

图6是概略地显示本发明一个实施例的ESG企业评价装置100从收集新闻报导的过程导出ESG企业评价分数的过程的框图。

如果参照图6,新闻报导是在执行企业评价方面成为基础的数据,ESG企业评价装置100可以按照定期或不定期的时间间隔,在互联网上收集新闻报导S601。

然后,ESG企业评价装置100可以将收集的新闻报导按企业及按日期分类S603,根据收集的新闻报导制作的语言,使用适合的语素分析器来分析相应报导S605。

ESG企业评价装置100以完成语素分析的新闻报导为基础,对各新闻报导进行矢量化后,可以通过矢量间的类似度分析,计算新闻报导间的类似度,将相关新闻集中在一起,执行分类归并S607。在该过程中,ESG企业评价装置100可以利用TF-IDF,对各新闻报导进行矢量化,可以通过余弦类似度计算,计算各新闻报导间的类似度。

ESG企业评价装置100可以就收集的各个新闻报导属于环境、社会及治理结构中哪个话题,属于环境、社会及治理结构各个话题的详细目录中的哪个进行分类S609。在该过程中,ESG企业评价装置100可以先决性地,以真或假(TRUE or FALSE)形态,将各新闻报导分类为是否是与执行ESG企业评价有关的报导,在各分类步骤中,可以采纳适合的机器学习算法,生成练习用数据,使得ESG企业评价装置100通过相应算法执行学习。EGG企业评价装置100的使用者可以使通过机器学习算法和练习用数据执行学习的ESG企业评价装置100,通过测试数据进行验证,由此执行S609步骤的各分类。

ESG企业评价装置100可以按S607步骤中分类的各群集单位,计算相应群集的各个ESG话题的证据级别值,算出相应群集的ESG几率值S611。在该过程中,ESG企业评价装置100可以将从新闻报导提取的名词分类为多个单词目录,将其分类为诸如环境、社会、治理结构、企业风险、其他相关问题的集合。然后,ESG企业评价装置100可以在所述集合中,算出关于环境、社会、治理结构的证据级别值,并算出ESG几率值。

最终,ESG企业评价装置100可以以S611步骤算出的证据级别值及ESG几率值为基础,算出最终的ESG企业评价分数S613。在该过程中,ESG企业评价装置100可以利用S611步骤算出的ESG几率值、分类为企业风险的集合的证据级别值。

根据本发明一个实施例,ESG企业评价装置100可以包括一个功能,在利用ESG企业评价结果的个人或企业针对特定企业要求得出评价分数的根据时,提供得出相应分数的根据。即,算出对特定企业报导的评价分数时,可以提供相应评价分数根据报导中存在的特定单词的频度数而受到较大影响的信息,也可以搜索并提供包含相应单词的报导。

如上所述,本发明实施例公开的ESG企业评价装置100执行自动化的企业评价,从而当在互联网上发行了关于特定企业的类似的新闻报导时,可以判断相应新闻报导涉及环境、社会、治理结构中的哪个话题,相应话题的风险重大到何种程度。

另一方面,本发明一个实施例的ESG企业评价装置100也可以在计算机可读记录介质中,体现为计算机可读代码。计算机可读记录介质包括存储可以借助于计算机系统而读取的数据的所有种类的记录装置。

例如,作为计算机可读记录介质,有只读存储器(ROM)、随机存取存储器(RAM)、只读光盘驱动器(CD-ROM)、磁带、硬盘、软盘、移动式存储装置、非易失性存储器(FlashMemory)、光数据存储装置等。

另外,计算机可读记录介质可以分布于以计算机通信网连接的计算机系统,作为能够以分布方式读取的代码而存储、运行。

以上参照附图,说明了本发明的实施例,但本发明所属技术领域的普通技术人员可以理解,本发明在不变更其技术思想或必需特征的情况下,可以以其他具体形态实施。因此,以上记述的实施例在所有方面应理解为只是示例性的,而非限制性的。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:检查装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!