动态申索提交系统

文档序号:1676878 发布日期:2019-12-31 浏览:9次 >En<

阅读说明:本技术 动态申索提交系统 (Dynamic claims submission system ) 是由 T·哈利斯 C·奥康奈尔 李玥 T·科罗列夫斯卡亚 于 2017-05-16 设计创作,主要内容包括:实施例涉及一种用于在申索提交中确定采访脚本的方法。所述方法可以包括接收与所提交的申索有关的数据,所述数据可以包括由用户输入的申索提交数据、与所述用户有关的信息及一个或多个特征。与所述一个或多个特征相关联的数据可以由人工智能模型确定。可以基于与所述一个或多个特征相关联的所述数据及和与所述用户有关的所述信息相关联的数据而确定第一得分并将其用于确定采访脚本。在一个实施例中,如果持续更新的得分保持高于预定阈值,那么可以继续将所述采访脚本中的问题提供给采访者计算机。在另一实施例中,如果持续更新的得分下降到低于预定阈值,那么可以将所述用户引导到与人类代表进行的真人采访。(Embodiments relate to a method for determining an interview script in an invoicing submission. The method may include receiving data relating to the submitted claim, which may include claim submission data entered by a user, information relating to the user, and one or more characteristics. The data associated with the one or more features may be determined by an artificial intelligence model. A first score may be determined based on the data associated with the one or more features and data associated with the information related to the user and used to determine an interview script. In one embodiment, if the continuously updated score remains above a predetermined threshold, the questions in the interview script may continue to be provided to the interviewer computer. In another embodiment, the user may be directed to a live interview with a human representative if the continuously updated score falls below a predetermined threshold.)

动态申索提交系统

相关申请交叉引用

无。

背景技术

在当今的技术环境中,各公司拥有各种处理投诉、上报或者个人提出的其它申索的系统。为了处理这些申索,这些公司通常允许个人通过因特网或通过手机连接到它们的系统。人类代表可能会就如何与个人互动进行培训,并且有时候代表会获得用于不同情形的一组指令,例如呈脚本形式。

申索提交系统可能产生各种技术问题。其中一个问题就是不诚实上报。犯罪分子为了牟利而想方设法欺骗制度的情况并不少见。例如,犯罪分子可能会了解公司处理各种申索的具体方案,并且可能会弄清楚如何回答具体的问题,以便获得呈账单积分或保险付款的形式的资金。如果采用的是静态预定脚本,那么这种情况可能会相对易于实现。另一问题是人为差错。对于通过因特网处理的申索提交系统,设计不佳的用户界面可能导致用户错误地输入错误的信息。本领域中需要的是一种用于以不易被欺骗或滥用且允许校正不准确信息的方式使申索提交过程自动化的方法。

本发明的实施例单独地且共同地解决这些问题和其它问题。

发明内容

各种实施例涉及一种用于在申索提交中确定采访脚本的方法。所述方法可以包括接收与所提交的申索有关的数据,所述数据可以包括由用户输入的申索提交数据、与所述用户有关的信息及一个或多个特征。所述方法可另外包括在数据库中存储与申索提交有关的数据并在数据库中检取与根据人工智能模型确定的一个或多个特征相关联的数据。可以基于与一个或多个特征相关联的数据及和与用户有关的信息相关联的数据而确定第一得分。可以至少基于第一得分而确定采访脚本,并且可以将采访脚本中的第一问题提供给采访者计算机。可以接收对第一问题的答复,并且可以至少基于数据库中的数据和对第一问题的答复而产生第二得分。可以至少基于第二得分而更新采访脚本,并且可以至少部分地基于第二得分,将采访脚本中的第二问题提供给采访者计算机。

在一个实施例中,如果持续更新的得分保持高于预定阈值,那么可以继续将所述采访脚本中的问题提供给采访者计算机。

在另一实施例中,如果持续更新的得分下降到低于预定阈值,那么可以将用户引导到与人类代表进行的真人采访。

其它实施例涉及与本文中所描述的方法相关联的系统、服务器计算机、客户端计算机、便携式消费装置和计算机可读介质。

参照下面的详细描述和附图可以获得对本发明的实施例的特性和优点的更好理解。

附图说明

图1示出描绘训练和使用机器学习模型的过程的高级图。

图2示出根据本发明的实施例的用于进行采访的系统的绘图。

图3示出根据本发明的实施例的服务器计算机的框图。

图4示出根据本发明的实施例的用于进行采访的过程流程图。

图5示出根据本发明的实施例的用于产生动态采访脚本的方法的流程图。

图6示出根据本发明的实施例的自动申索提交系统的数据流图的绘图。

图7示出根据本发明的实施例的构建用于产生采访脚本的人工智能模型的数据流图。

图8示出根据本发明的实施例的概念图中节点的路径的实例。

图9示出概念图的实例。

术语

术语“人工智能模型”或“AI模型”可以指可用于预测结果以便达成预定义目标的模型。AI模型可以使用学习算法来开发,其中训练数据基于已知的或推断的模式来分类。AI模型还可被称作“机器学习模型”或“预测性模型”。

“特征”可以指可用于辨识模式的数据的特性。输入特征可以是可由人工智能识别以进行预测的数据,如通过训练所学习。输入特征可以被识别为图形中的一系列一个或多个输入节点,例如包括输入节点的路径。例如,输入特征可以被识别为包括用于‘持卡人:Rick’、‘***遗失/被盗申索’及‘文本复制和粘贴’的输入节点的路径(集)。特征可以被组织为可搜索的格式,例如图形数据库或索引表。例如,输入特征可以被组织为可以进行编索引、查询及被分配值以进行预测的键值列表。当特征是检测到的数据时,AI模型可用于预测与特征相关联的数据,例如预测的风险或与特征相关联的欺诈概率。

“概念图”可以指基于人工智能的语义网络的逻辑的图形表示。概念图可包括概念和用于形成句子的概念关系。在概念图中,矩形节点可以表示概念,圆形节点可以表示概念关系。例如,参考图10,概念图可包括可以是句子的动词的概念901(前往)。概念901可以进一步与概念905(人员:Rick)、概念906(城市:奥斯汀)和概念907(火车)相联系,它们可以是分别通过概念关系902(施动者)、903(目的地)和904(工具)与“前往”相联系的名词。接着,概念图可用于形成句子,“Rick将要乘坐火车前往奥斯汀”。

“概念”可以指描述一般想法的词语或短语。例如,申索提交的采访可以由以下概念描述:‘持卡人:Rick’、‘***遗失/被盗’及‘高风险’。概念可以在拓扑图中表达为节点。在概念图中,概念可以由矩形表示。

“概念关系”可以指用于使概念相关的词语或短语。例如,概念‘持卡人:Rick’可以通过概念关系‘是’与概念‘高风险’相联系。概念‘持卡人:Rick’可以进一步通过概念关系‘申索’与概念‘***遗失/被盗’相联系。

“申索提交”可以指对所欠物品的请求。例如,申索提交可以是保险申索的提交,其中用户根据用户和保险提供商之间的保险单请求欠付资金。在另一实例中,申索提交可以是对报销与发布到某人的购买账户的欺诈***易相关的资金的请求。在又另一实例中,申索提交可以是对服务提供者可能授予其客户的维护/维修服务的请求。

术语“语言解析(language parsing/linguistic parsing)”可以指分析符号串以便辨识句子中的词语和短语并将它们分离,使得它们的关系和含义可以被理解。语言解析器可用于辨识所提交文本中的基元,例如与经常在欺诈性申索中提交的文本相关的基元。语言解析器的实例可包括斯坦福自然语言解析器。

“语义决策表”可以指决策规则映射到概念的决策表。概念可以是概念图中的概念,且决策规则可对应于形成采访问题的规则。用于确定语义决策表中的规则的概念关系可以表示为称为“lexons”的二元事实。有关语义决策表的更多信息请参阅:

Tang Y.、Meersman R.(2007)的《构建语义决策表》,出处:瓦纳尔R.、Revell N.、Pernul G.(编者),数据库和专家系统应用:Dexa 2007,计算机科学讲义,第4653卷,斯普林格,柏林,海德堡。

术语“普通逻辑交换格式”可以指用于指定普通逻辑的标准。“普通逻辑”可以指意在促进知识在基于计算机的系统中交换和传输的逻辑语言系列的框架。普通逻辑的ISO标准描述于ISO/IEC 24707:2007中。更多信息请参阅:https://www.iso.org/standard/39175.html。

术语“蚁群优化”可以指用于解决可缩小为通过图形查找最短路径的计算问题的概率性技术。蚁群优化算法可包括其中在后续迭代之间将路径信息传送到多个计算代理的算法。

“拓扑图”可以指在边缘连接的不同顶点的平面中的图形的表示。拓扑图中的不同顶点可以被称为“节点”。每个节点可以表示事件的特定信息,或者可以表示实体或对象的简档的特定信息。可以由一组边缘E使节点彼此相关。“边缘”可以被描述为由作为图形G=(V,E)的子集的两个节点构成的无序对,其中G是包括由一组边缘E连接的一组顶点(节点)V的图形。例如,拓扑图可以表示交易网络,在所述交易网络中,表示金融交易的节点可以由边缘连接到与交易相关的一个或多个节点,例如表示装置、商家、交易类型等的信息的节点。边缘可与被称为“权重”的数值相关联,所述数值可分配到两个节点之间的成对连接。边缘权重可以被识别为两个节点之间的连接强度和/或可以与成本或距离相关,因为它常常表示从一个节点移动到下一个节点所需的量。

“序列图形”或“图形序列”可以指数字序列,其可以是图形的度序列。对于无方向图形,“度序列”可以指图形中的节点序列。例如,度序列可以识别用于建立AI模型的规则的节点路径。

具体实施方式

本发明的实施例涉及一种用于确定采访脚本的方法。本文详细描述中描述的实施例可包括使用人工智能(AI)模型基于所提交申索的特征来产生采访脚本的方法。AI模型可以向采访者计算机提供问题,使得所处理申索中只能包括准确的信息。这可以通过提供有助于澄清错误输入信息的后续问题来完成。在提交虚假申索的情况下,可以在虚假申索的提交者退出采访之前一直向他询问问题。用于评估潜在欺诈性申索或含有潜在不准确信息的申索的风险的特征可包括与用户信息相关联的数据和与由用户输入的文本相关联的数据,如通过AI习得的模式所识别。AI可以不断适应与不诚实申索提交相关联的新特征,并且可以动态地更新采访脚本,使得犯罪人员难以欺骗(game)申索提交系统。

I.发明概述

本发明的实施例涉及一种用于使用人工智能产生动态采访脚本的系统。图1示出描绘训练和使用机器学习模型的过程的高级图。过程100从训练数据开始,示出为现有记录110。训练数据可包括各种数据样本,其中每个数据样本包括输入数据和已知的输出数据。例如,可以横跨多个网络从各种来源聚合训练数据,所述网络例如是交易网络和社交媒体网络。输入数据可以是用户的简档数据(例如,用户的交易记录或社交媒体数据),输出数据可以是他们的行为分类(例如,高风险个人或低风险个人)。

获得训练数据后,可以使用学习过程来训练模型。示出学习模块120接收现有记录110,并且在执行训练之后提供模型130。因为数据样本包括已知对应于特定输入的输出,所以模型可以学习对应于输出的输入类型。一旦模型130已经经过训练,它就可以用于预测包括新输入的新请求140的输出。举例来说,模型130可以是能够基于用户的通信特征预测用户是否撒谎的模型。示出了模型130基于新请求140提供预测输出150。预测性输出150可以是预测实现所需结果的任何输出,例如预测阻止犯罪人员的短语或问题。以这种方式,可以使用大量的训练数据来创建可以有利地用于特定问题的人工智能。如上文所解释,本文中所述的发明利用人工智能模型,旨在产生动态采访脚本。采访脚本可以用于例如处理如保险申索的申索,或者可以用于被采访者在特定事项上需要帮助的任何交互。

图2示出根据本发明的实施例的用于进行采访的系统的绘图。系统200可包括用户装置202、采访者计算机210和服务器计算机220。用户装置202可由用户201操作,并且可以与采访者计算机通信210。采访者计算机210可以接收来自例如服务器计算机220的一个或多个服务器计算机的后端支持。另外,服务器计算机220可以耦合到或可接入一个或多个数据源(即,数据库),例如聚合数据数据库230、短期历史240和图形数据库250。

根据本发明的实施例,用户201可以使用用户装置202与采访者计算机210进行采访(例如,以便进行申索提交或上报事故或破损的装置)。这可以通过经由例如因特网或电信网络的网络270建立与采访者计算机210通信的信道来完成。用户装置202可以是用于通过网络270将信息发送到采访者计算机210的任何装置,例如个人计算装置、笔记本电脑、移动通信装置、电话等。用户装置202可用于发送可以由采访者计算机210接收和处理的呈数据形式的消息。例如,用户装置202的输入装置,例如键盘,可用于产生可以作为数据发送到采访者计算机210的文本。在另一实例中,用户装置202可用于通过电信网络发送语音消息,采访者计算机210可以接收所述语音消息并将其处理成数据。在又一实例中,用户装置202可用于拍摄图片,并产生可以发送到采访者计算机210的图像文件。

由采访者计算机210从用户装置202接收的消息可包括与申索提交有关的数据。申索提交可以是任何对所欠物品的请求。例如,申索提交可以是保险申索的提交,其中用户根据用户和保险提供商之间的保险单请求欠付资金。在另一实例中,申索提交可以是对报销与发布到某人的购买账户的欺诈***易相关的资金的请求。在又另一实例中,申索提交可以是对服务提供者可能授予其客户的维护/维修服务的请求。

与申索提交有关的数据可以从采访者计算机发送到服务器计算机220。服务器计算机220可以是用于接收、处理、存储、检取和发送数据的任何服务器计算机。例如,服务器计算机220可以是可以接收、处理、存储、检取和发送与交易有关的数据的交易处理网络(例如,Visanet)的服务器计算机。在一个实施例中,服务器计算机220可以是客户端-服务器模型中接收、处理、存储、检取和向客户端计算机发送数据的服务器计算机。客户端计算机可以是例如采访者计算机。在另一实施例中,服务器计算机220可以是基于云的模型中接收、处理、存储、检取和发送数据的服务器计算机。

服务器计算机220可以存储、更新并从一个或多个数据库检取数据,所述数据库例如是聚合数据数据库230、短期历史数据库240和图形数据库250。一个或多个数据库中的数据可以是供服务器计算机220用于产生人工智能(AI)模型并使用人工智能模型进行预测的数据。AI模型可以在服务器计算机220上运行,并且可用于预测适当答复以实现预定目标。在本发明的一个实施例中,预定目标可以是防止虚假或不准确的信息被包括在所处理的申索中。这可以例如通过预测并产生可以阻止犯罪人员继续进行申索提交的答复或产生澄清经常不正确地输入的信息的答复来完成。

聚合数据数据库230可以存储横跨多个网络共享的聚合数据。聚合数据可以由服务器计算机220访问,并且可用作AI模型的训练数据。例如,聚合数据可以在交易网络中收集,并用于产生与交易各方的行为有关的预测性模型。聚合数据的实例可包括欺诈数据、实时数据提要和其它外部数据。欺诈数据可包括关于欺诈***易的数据,例如将交易标识(例如,账号、用户ID、装置ID等)与上报的欺诈例项相联系的禁止列表。实时数据提要可包括通过网络实时接收的数据,例如用于进行交易的数据。其它外部数据可包括可以提取并用于进行预测的任何其它数据,例如人口普查数据、金融数据、社交媒体数据等。在一个实施例中,聚合数据可以是根据Apache Hadoop框架横跨多个计算机存储和处理的数据。

短期历史240可包括可用于进行当前预测的短期数据。短期数据可包括对AI模型的先前请求(即,对预测的历史请求),其可用于检测存在于信息中的特征并预测目前结果。例如,短期数据可包括在用户装置202和采访者计算机210之间发送的消息或在其它用户装置和其它采访者计算机之间发送的其它消息的历史。消息历史可用于确定对从用户装置202发送到采访者计算机210的当前消息的适当答复(例如,对由用户201提交的答案的后续问题)。

图形数据库250可包括用于产生采访脚本的图形数据。图形数据可包括用于表示知识和推理的多个概念图。多个概念图可用于表示AI模型的语义网络中所使用的概念。例如,图形数据可包括表示用于形成句子的词语和短语的适当组合的多个概念图。所形成的句子可用于在采访期间向用户201产生答复,如使用在服务器计算机220上运行的AI模型所确定且如采访者计算机210所递送。

根据本发明的实施例,由服务器计算机220接收和/或检取的数据可用于构建用于进行预测的AI模型。AI模型可用于确定采访(例如,申索提交)中对用户201的答复。所产生的答复可以是预测帮助识别不准确的信息的答复。例如,由AI模型预测的适当答复可以是澄清用户201是否将文本正确地输入到用户装置202中的后续问题(例如,“您住在德克萨斯,是否正确?”)。在另一实例中,答复可以是显示用户201可能提供虚假信息的后续问题(例如,“您在何时首次注意到您的卡丢失或被盗”)。

服务器计算机220可以使用聚合数据数据库230中的聚合数据作为用于构建和更新AI模型的训练数据。例如,与采访问题、用户答复、先前采访的先前结果有关的数据及外部数据(例如,欺诈数据)可用于识别模式。这可以例如使用学习算法针对所要结果的预测性对多个采访问题和用户答复进行评分来完成(例如,如果采访问题阻止了欺诈人员或与已知欺诈申索事件相联系的用户答复获得高风险得分,那么采访问题具有高得分)。可以就预测性进行评分并用于训练和产生更好的拟合模型的特定信息类型可被称作特征。例如,特征可以是用户答复问题的速度,并且特征可以就它与高欺诈概率的关系进行评分(例如,在不到1秒内答复的问题可以指示欺诈性行为,并且可以接收高得分)。如果在对AI模型的未来请求中检测到高评分特征(例如,答复时间不到1秒),那么AI模型可以根据已知的它与特定结果(例如,高欺诈概率)的相关性基于特征进行预测。

在采访期间,消息可以在用户装置202和采访者计算机210之间发送,并且可包括可以发送到服务器计算机220的数据。数据可以存储在短期历史240中,并且可以是与申索提交有关的数据。与申索提交有关的数据可包括由用户201输入的数据(例如,文本)、与用户201有关的信息(例如,名称、账号、装置ID、IP地址等)及一个或多个特征(例如,风险特征)。一个或多个特征可以是可以进行识别并用于AI模型进行预测的预测性特征。在一个实施例中,一个或多个特征可包括日时间、申索类型、输入方法和/或平均答复时间。在另一实施例中,一个或多个特征还可包括由用户输入的文本的特征。例如,可以使用自然语言解析器来解析句子并确定指示特定行为的特征,所述特定行为例如是撒谎。

一个或多个特征可供在服务器计算机220上运行的AI模型用于确定与一个或多个特征相关联的数据。例如,在服务器计算机220上运行的AI模型可以将一个或多个特征与预测结果的索引表(例如,每个特征的相关联风险)比较,如通过训练所学习。服务器计算机220可以进一步确定和与用户201有关的信息相关联的数据。例如,服务器计算机220可以从聚合数据数据库230检取将用户201的账号与高风险行为(例如,已识别的欺诈或低信用得分)相联系的数据。

根据AI模型确定的数据和与用户201相关联的数据可接着供服务器计算机用于确定采访的第一得分。第一得分可以是例如评定当前评估的用户201不诚实或用户201所提交的信息不准确或虚假的风险的风险得分。风险得分可以通过服务器计算机220存储在短期历史240中,并且可用于更新AI模型。例如,风险得分可用于对一个或多个特征的预测性进行评分,使得AI模型所做出的未来预测可以更加准确。

接着,服务器计算机220可至少基于第一得分而确定采访脚本。在一个实施例中,服务器计算机220可以基于第一得分、与用户201相关联的数据以及与由用户201输入的信息相关联的数据而在图形数据库250中查询概念图(例如,包括用户所输入的文本或其特征的词语的概念图)。例如,服务器计算机220可以确定识别为‘持卡人:Morty’的用户在不到一秒内提交了含有词语“新加坡”的答复。AI模型可用于确定答复与90分的风险得分(共100分)相关联。接着,服务器计算机220可产生图形查询,包括‘持卡人:Morty’、‘新加坡’和‘风险得分=70或更高’。可执行图形查询以从图形数据库250中检取包括用于‘持卡人:Morty’、‘新加坡’和‘风险得分=70或更高’的节点的概念图。概念图可包括用于通过概念关系联系在一起的概念(例如,‘Morty’、‘新加坡’、‘风险得分=70或更高’)的节点。例如,概念可以通过以下概念关系联系起来:‘施动者’、‘居住’、‘是’和‘发起’,这可以导出发起以下决策的含义:‘Morty居住在新加坡,且为高风险[风险得分>70]。发起脚本A:高风险’。接着,可以根据概念图确定采访脚本(例如,‘脚本A:高风险’),并且可以将来自采访脚本的后续问题发送到用户装置202(例如,“您想继续用普通话进行采访吗?”)。

根据实施例,可以评估用户对来自所确定采访脚本的后续问题的答复,以确定采访的第二得分。例如,针对手机采访确定的采访脚本可包括以下问题:“您母亲的婚前姓是什么?”用户可以立即并且以确定为低风险的方式答复(例如,用于基于音频数据的特征预测撒谎用户的风险的AI模型可以确定低风险得分)。用户答复的特征可以改变采访得分,且采访的第二得分可以引起不同查询。例如,可执行第二图形查询,其中概念图可包括用于发起以下决策的节点:‘Morty为低风险。发起脚本A:低风险’。接着,可基于图形查询更新所确定采访脚本,并且可以将采访脚本中的第二问题发送到用户(例如,“您母亲的婚前姓是‘Smith’是否正确”)。

在一个实施例中,可以产生所确定采访脚本,使得识别为可能提供虚假或不准确信息的个人无法提交申索进行处理。可以产生所确定的采访脚本中的自动问题,使得关于不准确性评分较高的采访可以获得更积极的问询,以便从用户201提取更多信息。在一个实施例中,自动问题/答复可以不断地发送给用户201,直到用户201终止申索提交或提交将采访的风险得分降低到低于预定阈值(例如,通过提供准确信息)的答复为止。在另一实施例中,识别为低风险或提供准确信息的个人可以被引导到可以处理提交的申索的真人代理(即,真人采访者)。

图3示出根据本发明的实施例的服务器计算机的框图。服务器计算机300A可以是根据本发明的实施例的用于接收、处理和发送数据的任何服务器计算机,例如图2的服务器计算机220。服务器计算机300A可包括处理器310、网络接口320和计算机可读介质230。计算机可读介质230可包括可用于实行本发明的实施例的代码的一个或多个模块。例如,计算机可读介质230可包括通信模块330A、语言解析模块330B、输入方法分析模块330C、用户历史查找模块330D、风险确定模块330E、学习模块330F、图形查询模块330G、脚本确定模块330H、真人采访引导模块330I、音频文件分析模块330I、图像文件分析模块330K和视频文件分析模块330L。服务器计算机200A可以进一步耦合到一个或多个数据库,例如聚合数据数据库300B、短期历史300C和图形数据库300D,它们可分别对应于图2的聚合数据数据库230、短期历史240和图形数据库250。

通信模块330A可包括用于指示处理器310接收、发送和重新格式化可以通过网络接口320接收的消息的代码。例如,通信模块可包括用于在采访过程期间,例如在申索提交期间,通过网络(例如,图2的网络270)接收和发送消息的代码。

语言解析模块330B可包括用于指示处理器310分析符号串的代码。例如,符号串可以是在消息中接收的文本,并且语言解析模块330可包括用于辨识句子中的词语和短语并将它们分离以便理解它们的关系和含义的代码。在一个实施例中,语言解析模块330B可包括用于例如斯坦福自然语言解析器的自然语言解析器或统计解析器的代码。

输入方法分析模块330C可包括用于指示处理器310确定与所接收数据最初由用户如何输入有关的信息的代码。在一个实施例中,输入方法分析模块可包括用于确定如何快速输入文本数据、确定输入文本是否已经复制并粘贴和/或确定键入信息之间的停顿长度的代码。例如,输入方法分析模块可用于确定图2的用户201通过快速复制并粘贴存储在用户装置202上的预定答复来回答采访问题,此特征随后可识别为欺诈性申索提交的有力预测符。

用户历史查找模块330D可包括用于指示处理器310查找和与用户有关的信息相关联的数据的代码。例如,用户历史查找模块330D可包括用于确定用户ID或装置ID和从在消息中接收的数据(例如,与申索提交有关的数据)提取的其它用户信息的代码,并且可另外包括用于在聚合数据数据库300B中查询与用户ID或装置ID相联系的数据的代码。数据可包括与用户有关的行为历史,例如采访历史(例如,申索提交历史)、已知欺诈例项,或用户信息被盗的上报。

得分确定模块330E可包括用于指示处理器310确定与所接收数据相关联的得分的代码。在一个实施例中,得分可以是与采访中的用户答复相关联的或采访自身的得分。得分可以基于一个或多个特征和与用户及其答复相关联的数据而确定。例如,得分确定模块330E可包括用于辨识与用户在申索提交中输入的文本相关联的一个或多个风险特征的代码。得分确定模块330E可另外包括用于基于一个或多个风险特征而确定风险得分的代码。根据本发明的实施例,风险特征的实例可包括发送消息的日时间、申索类型、所接收数据的输入方法和/或平均答复时间(即,在问过采访问题之后输入数据的速度)。

学习模块330F可包括用于指示处理器310训练AI模型进行关于所接收数据的预测的代码。例如,学习模块310可包括可用于基于存储在数据库中的数据产生并更新AI模型的机器学习算法。AI模型可用于基于输入数据进行预测。例如,预测性模型可用于基于用户的答复(例如,基于申索提交中的文本)预测适当的后续采访问题。

图形查询模块330G可包括用于指示处理器310执行对存储在图形数据库中的图形的查询的代码,所述图形数据库例如是概念图数据数据库300C。例如,图形查询模块330G可包括用于在图形数据数据库300C中查询与特定风险得分和/或一组文本相联系的概念图的代码。所述特定风险得分和一组文本可以是与申索提交有关的信息(例如,由用户输入的一组文本)。在一个实施例中,将由图形查询模块330G查询的图形可用于确定语义决策表中的二元事实,或“lexon”,以便推动采访脚本。例如,图形可包括风险得分和采访的概念(即,词语或短语)之间的关系,其可用于确定采访的适当路径,如由包括申索提交规则的预构建语义决策表限定。

脚本确定模块330H可包括用于指示处理器310基于所查询图形而确定脚本的代码。例如,脚本确定模块330H可包括用于确定与和概念图有关的信息相关联的一组文本的代码。与概念图有关的信息可包括可用于形成句子的概念和概念关系。在一个实施例中,与概念图有关的信息可以是语义决策表中的信息,例如反映不同组采访概念的规则的lexon。

真人采访引导模块330I可包括用于指示处理器310将用户装置连接到真人采访者的代码。例如,真人采访引导330I可包括用于将用户装置(例如,图2的用户装置202)从与运行自动脚本的采访者计算机(例如,图2的采访者计算机210)连接引导到采访者计算机或呼叫中心的代码,用户装置可以与采访者计算机或呼叫中心的可以处理申索的代表对话。在一个实施例中,如果确定所提交申索为真(例如,极低风险得分),那么可以发起真人采访引导模块330I。

音频文件分析模块330J可包括用于指示处理器310分析音频文件的特征的代码。例如,音频文件分析模块330J可包括用于检测答复的较长停顿的代码,或者可以检测用户声音的音调变化。音频文件的特征可以是可由AI模型在数据中反复辨识出的且可以指示特定行为的任何模式。例如,用于申索提交的其中用户声音相对单调的音频文件可以指示欺诈性申索。在另一实例中,用于用户上报事故的其中用户声音颤抖或急促的音频文件可以指示用户是真诚地在上报真实事故。

图像文件分析模块330K可包括用于指示处理器310分析图像文件的特征的代码。例如,图像文件分析模块330K可包括用于辨识面部特征以辨识用户的代码。在其它实例中,图像文件分析模块330K可包括用于辨识可与所提交申索有关的对象特征的代码,例如***的特征、条形码、包装、车辆、产品、破损地身体组织等。图像文件的特征可以是可以由AI模型在数据中反复辨识出的且可以含有更多信息以进行更好预测的任何模式。例如,汽车事故的照片的图像文件可包括特定光量作为特征,其可以指示拍摄照片的日时间,或者可以指示某一其它模式,例如申索提交的某一风险等级。在另一实例中,图像文件可以含有颜色或对比度的细微差异,它可以是利用特定类型或特定制造商的相机镜头拍摄的照片的特征,所述特征可以进一步与申索提交的某一风险等级相关联。

视频文件分析模块330L可包括用于指示处理器310分析视频文件的特征的代码。例如,视频文件分析模块330L可包括用于辨识与为欺诈性申索所提交的视频相同或类似的视频的特征的代码。视频文件的特征可以是可以由AI模型辨识并且可以辅助进行更好预测的任何模式。例如,视频长度或文件大小可以是指示所提交申索是欺诈性还是真实的特征。

根据本发明的实施例,服务器计算机300A可以为采访计算机提供后端支持,所述采访计算机例如是图2的采访者计算机210。服务器计算机300A可用于产生自动采访脚本,其包括预测帮助识别不准确或虚假信息的答复。脚本另外可以是包括预测阻止犯罪人员/防止不准确或虚假信息被包括在所处理申索中的问题的脚本。

图4示出根据本发明的实施例的用于进行采访的过程流程图。根据本发明的实施例,可以在用户装置(例如,图2的用户装置202)和采访者计算机(例如,图2的采访者计算机210)之间进行采访。采访计算机可以使其对用户装置的用户(例如,图1的用户201)的答复基于可使用AI模型确定的采访脚本。

过程400可以开始于步骤S401,其中可以开始用户装置和采访者计算机之间的采访。采访可以由建立与采访系统(例如,申索提交系统)的连接的用户发起。连接可以通过经由网络在用户装置和采访者计算机建立连接来建立。例如,用户可以使用用户装置连接到因特网,并且可以通过从浏览器访问网站与采访系统建立连接。在另一实例中,用户装置可以是手机,并且用户可以通过电信网络与采访系统建立连接。在与采访系统连接后,用户可以开始与采访者计算机的采访。

在步骤S402,用户可以使用用户装置提交初始数据。初始数据可以是与申索提交有关的数据,其中可包括由用户提交的文本、音频、图像或视频。例如,采访系统可以提供用户接口,所述用户接口可以在用户的装置上显示并且可允许用户输入文本。初始数据可以被发送到采访者计算机并被转发到服务器计算机(例如,图3的服务器计算机300A)。文本可包括对所提交的申索或所上报的事故的描述。例如,用户可以使用用户装置的输入装置(例如,键盘)输入文本:“您好,我想要上报一张被盗的***”。在另一实例中,用户可以通过手机联系采访系统。用户可以通过语音提交申索信息,并且所提交音频可以被处理成数据。在又另一实例中,用户可以使用他或她的手机向采访系统发送发起申索提交过程的短消息服务(SMS)文本消息。与申索提交有关的数据的其它实例可包括图像数据(例如,用户的自拍、***的照片、受损车辆的图像等)或视频数据(例如,用户想要上报的事故的视频或用户说明事故的视频)。

在步骤S403,可以收集用户装置数据。在一个实施例中,可以通过分析消息的标头来收集用户装置数据。例如,采访者计算机可以从用户装置接收数据消息,其中用户装置的装置ID和/或IP地址被写入到消息的标头中。在另一实施例中,用户装置可以是手机,并且用户装置数据可包括电话号码和手机的位置。例如,采访者计算机可以接收在消息开始处包括用户数据标头(UDH)的SMS或多媒体信息服务(MMS)文本消息。根据实施例,用户装置数据可以由采访者计算机接收并被转发到服务器计算机。

在步骤S404,可以将由用户输入的初始数据和所收集的用户装置数据存储在短期历史中。短期历史可以是包括可用于确定采访脚本的数据的数据库。例如,短期历史可包括用户装置和采访者计算机之间的当前对话数据。数据可包括可用作AI模型的输入的特征。AI模型可以是训练成预测有助于识别申索提交中的准确和不准确信息的适当答复的AI模型。

在步骤S405,服务器计算机可以从与申索提交有关的数据确定一个或多个特征,并且可以从数据库(例如,图2的聚合数据数据库230)检取与所述一个或多个特征相关联的数据。例如,服务器计算机可以分析与申索提交有关的数据(例如,使用图3的输入方法分析模块330C)以确定日时间、申索类型和输入方法,它们可以被辨识为与采访的不同风险等级相联系的风险特征。接着,与一个或多个特征相关联的数据可存储在短期历史中。在一个实施例中,与一个或多个特征相关联的数据可以是使用AI模型确定的数据。例如,可以使用学习算法训练AI模型,以预测与一个或多个风险特征相关联的风险等级。

在步骤S406,服务器计算机可以检取用户的历史。在一个实施例中,服务器计算机可以从数据库检取用户的历史。例如,服务器计算机可以在图2的聚合数据数据库230中查询与用户和/或用户装置相联系的数据。这可以基于在步骤S403收集的用户装置数据来完成(例如,在数据库中查询与装置ID或IP地址相联系的数据)。可以检取的用户历史的实例可以是用户的先前申索提交的数据、已识别出的与用户装置相联系的欺诈例项或可与用户行为相关联的任何其它数据。接着,用户的历史可存储在短期历史中。在一个实施例中,用户的历史可包括和与用户有关的信息相关联的风险数据。例如,用户的历史可包括与用户的通信因素(例如,IP地址、装置ID、电话号码等)相关联的风险等级。在实施例中,可以从索引表确定相关联的风险。索引表可包括用于用户的各种通信因素的风险索引,如由AI模型所预测,例如通过提升树(boosted tree)或神经网络。可以从交易处理网络(例如,VisaNet)中的数据以及可以从其它来源聚合的与IP地址行为有关的外部数据实时地预测风险索引。

在步骤S407,服务器计算机可以基于存储在短期历史中的数据计算采访的初始得分。初始得分可以至少基于分别在步骤S405和S406处收集的特征数据和用户历史而确定。初始得分可以基于特征数据的预测性而确定,如通过训练所学习。学习算法可用于对随后可存在于数据中的特征的预测性进行评分,并且可以基于所学习的得分预测与特征相关联的输出。例如,可以使用梯度提升来填充索引表或决策树,其中特征数据的各种组合可以分别与不同采访得分相联系。在一个实施例中,可以使用用于评定所提交申索是欺诈性的可能性的风险模型来产生采访的风险得分。例如,可以使用例如随机决策森林的集成学习方法来产生用于预测与IP地址和所输入用户文本相关联的欺诈概率的回归树。当在申索提交中接收到数据时,与所提交申索相关联的IP地址和所输入文本可以与回归树比较,以便确定风险得分,从而对欺诈申索的肯定识别概率进行评分。例如,用户可能输入了与确定为高风险的先前采访完全相同的文本,这可能会因为它与已知欺诈实例的较高相关性而产生高风险得分(例如,按照0到100的等级,90分的风险得分)。

在步骤S408,服务器计算机可以基于初始得分确定是否应该发起与真人采访者的真人采访。在一个实施例中,如果确定初始得分指示与申索提交有关的数据有很高概率含有100%准确的信息,那么可以发起真人采访。例如,用户可以提交对客户支持的请求,所述请求可以确定为具有低风险得分(即,真实申索提交),并且因此可以保证发起可以帮助用户的与人类代表进行的真人采访。在实施例中,如果采访得分下降到低于预定阈值(例如,低于50的风险得分),那么可以发起与人类代表进行的真人采访。

在步骤S409,服务器计算机可以更新用于确定采访脚本的AI模型。在一个实施例中,可以更新AI模型,使得特征数据和用户历史可以相关。例如,用户历史可含有已经被识别为欺诈性的数据,因此由用户输入的文本的一个或多个特征可与AI模型中的欺诈相关。这可能会在采访期间影响AI模型所做出的预测。例如,如果后续申索提交中重复相同文本,那么后续申索提交可以确定为与欺诈相关联。在另一实施例中,可以更新AI模型,使得用户历史和一个或多个特征可以与较高风险相关联。例如,一个或多个特征可以使采访获得高风险得分,这可以使用户的历史(例如,用户ID、装置ID、IP地址等)与AI模型中的较高风险相关。

在步骤S410,服务器计算机可以基于AI模型所做出的预测而在图形数据库中查询图形。图形可以是使概念与所预测的风险等级有关的概念图。在一个实施例中,AI模型可以接收采访的初始得分、由用户输入的初始数据(即,文本)、一个或多个特征和用户历史,作为用于预测适当图形查询的输入。在一个实施例中,图形查询可以用普通逻辑交换格式表示。例如,与‘申索人123’上报未被采纳的采购项目有关的图形查询可表达为(存在((x上报)(y欺诈-未采纳))(和(申索人123)(施动者x 123)(类型x y)))。在一个实施例中,在图形数据库中查询并检取的图形可以是用于形成句子的概念图。在另一实施例中,服务器计算机可以将查询到的图形发送到采访者计算机,由此可以确定采访脚本。在又一实施例中,查询到的图形可用于识别欺诈概率。例如,可以使用用于查找图形中的最短路径的优化技术(例如,蚁群优化)来查找图形内将概念与欺诈的肯定指示相联系的路径。欺诈概率可以随申索的复杂性、将检测到的概念与欺诈相联系的路径的开销(即,拓扑图中路径的边缘权重)以及与申索的潜在货币化或补偿有关的各种因素而变。例如,欺诈概率可以计算为:‘欺诈概率=f(申索复杂性,路径开销,检测便易性,补偿金额)’。关于使用蚁群优化查找图形中的最佳路径的更多信息可参阅:

C.Blum,“蚁群优化:简介和最新趋势”,生命物理学评论(Phys.LifeReviews),第2卷,第353-373页,2005年。

在步骤S411,可以根据从图形数据库检取的图形确定采访脚本。图形可以是可用于形成可在采访中使用的一个或多个答复(即,句子)的概念图。例如,可以检取含有词语“位置”、“用户”、“居住”的概念图,它可用于形成句子:“您居住在哪里?”。在一个实施例中,可以由采访者计算机或操作采访者计算机的代理确定采访脚本。在另一实施例中,查询到的图形的信息可以存储在语义决策表中。语义决策表可以含有用于将AI的预测结果与事实或lexons相联系的逻辑。例如,AI模型可以预测采访的‘高风险’结果,此结果可以在语义决策表中与词语或短语联系,所述词语或短语可以与询问某人居住在哪里的后续问题相联系。

在步骤S412,可以将采访脚本的答复发送给用户和/或用户装置。在一个实施例中,可以在消息中将答复从采访者计算机发送到用户装置。例如,可以通过因特网以含有用户可以理解的文本的消息的形式将答复发送到用户装置(例如,在文本消息中或通过HTML)。在另一实施例中,可以将答复从采访者计算机的操作者发送给用户。例如,操作者可以读取所确定的采访脚本并通过手机将采访脚本的答复传送给用户。

在步骤S413,用户可以接收采访脚本的答复,并且可以输入额外数据。额外数据可以是与申索提交有关的额外数据。例如,用户可以接收采访脚本的问题,并且可以通过将文本输入到用户装置中来产生答案。文本可以是可用于确定所提交的申索是不是欺诈性的额外信息。额外数据可以发送到采访者计算机,并且接着转发到服务器计算机。

在步骤S414,服务器计算机可以接收额外数据,并且可以更新短期历史。更新短期历史可包括存储额外数据以及与从额外数据辨识的一个或多个特征有关的数据。例如,额外数据可包括复制并粘贴的文本,这可以是可用于计算采访的后续风险得分的风险特征。除了在步骤S404存储的短期数据,还可以将风险特征存在于用户答复中的记录以及答复自身添加到短期历史中。

在步骤S415,服务器计算机可以计算采访的后续得分。后续得分可以使用用户输入的额外数据、与额外数据相关联的一个或多个特征和/或存储在短期历史中的任何其它数据(例如,在步骤S404存储的数据)来确定。例如,服务器计算机可以基于用户对后续问题的答复的文本并基于文本的输入方法来确定采访的后续风险得分。

在步骤S416,服务器计算机可以确定采访的得分是否已改变。例如,如果用户已经答复采访脚本的后续问题,那么得分可以保持不变。如果采访的得分尚未改变(例如,用户尚未答复),那么服务器计算机可以执行步骤S417。否则,服务器计算机可以在这个过程中返回到执行步骤S408。服务器计算机可以继续更新模型,执行图形查询并确定脚本,并且用户可以继续答复以影响采访的得分,直到采访终止为止或直到确定应该发起真人采访为止(即,在S408或S417的答案为“是”之前一直执行步骤S409至S416)。例如,如果采访的风险得分随着每个后续问题和用户答复逐渐增加,那么可以向用户不断地发送后续问题,直到用户退出采访或开始输入降低风险得分的准确信息为止。如果风险得分下降到低于阈值,那么可以确定所提交的信息真实并且可以发起真人采访。

如果在步骤S416,确定采访的得分尚未改变,那么可以执行步骤S417,其中服务器计算机可以确定用户是否已终止采访。这可以例如通过检查连接是否仍存在于用户和采访者计算机之间来完成。在另一实例中,采访者计算机可以向用户装置发送含有问题文本的消息,所述问题例如是“您还在吗?”。用户可以答复问题,从而指示采访尚未终止。如果确定用户已终止采访,那么服务器计算机可以执行步骤S420,其中终止采访脚本并结束会话。否则,服务器计算机可以返回到步骤S413,其中服务器计算机等待用户输入额外数据。用户答复所花费的时间可以被识别为特征(即,用于使用AI模型进行预测),并且可用于更新短期历史。

如果在步骤S408,确定应该发起真人采访,那么可以执行步骤S418。在一个实施例中,如果采访的得分下降到低于预定阈值(例如,低风险得分、低不准确性得分等),那么可以发起真人采访。在步骤S418,可以请求真人代理。可以由服务器计算机通过确定真人代理的地址来请求真人代理。例如,服务器计算机可以在IP地址列表中搜索真人代理所操作的计算机,并且可以向计算机广播指示用户需要连接到真人代理的消息。在另一实例中,服务器计算机可以在电话号码列表中搜索可以联系真人代理的电话号码,并且可以试图通过电信联系代理。

在步骤S419,服务器计算机可以将用户装置引导到真人代理。例如,真人代理可以接收已经请求真人代理的用户队列,并且真人代理可以从队列中选择一个用户。接着,服务器计算机可将用户装置引导到真人代理的计算机或电信装置。真人代理可以进一步接收用户的信息。例如,用户输入的初始数据、用户的历史以及与用户和采访者计算机之间的采访有关的其它信息可以被发送和显示给真人代理。

在步骤S420,可以终止采访脚本。例如,用户可能已经成功引导到他们可以继续进行与之采访的真人代理,或者用户可能已经决定退出采访。根据本发明的实施例,可以进行采访,使得真正用户可以连接到可以处理所提交申索的真人代理,而高风险或不诚实用户可以继续接收采访脚本的问题,直到他们退出或提交准确信息为止。

图5示出根据本发明的实施例的用于产生动态采访脚本的方法的流程图。步骤S501至S511可以提供由系统执行的步骤列表,所述系统包括用户的用户装置、采访者计算机和服务器计算机(例如,图2的系统200)。

在步骤S501,可以在数据中接收用户输入、用户信息和其特征。数据可以从用户装置接收,并且可以是与申索提交有关的数据。例如,数据可包括对用户想要提交的申索的文本描述。用户输入和用户信息的特征可以是可能为欺诈性的申索提交的风险特征,例如日时间、申索类型和输入方法。

在步骤S502,可以将数据存储在短期历史中。短期历史可以是存储AI模型可以用来进行关于采访的预测的数据的数据库。例如,可以训练AI模型以基于在采访中接收的数据的一个或多个特征来进行预测,所述特征例如日时间、申索类型、输入方法和/或用户答复所花费的时间。预测可以是基于特征对采访所评估的风险,它可以进一步组合用户历史使用以确定风险得分。

在步骤S503,可以检取与数据的特征相关联的数据。与特征相关联的数据可以是通过AI模型预测的数据。AI模型可以是将来自短期历史的数据视作输入并输出预测的预测性模型。例如,可以训练AI模型以对特征进行评分,所述特征当在申索提交中接收的数据中检测到时可用于预测与申索提交相关联的风险等级或风险数据。申索提交的风险特征的实例可包括申索类型、申索复杂性、补偿方法、申索的货币化可能性以及所提交申索或其文本的可重复性。

在步骤S504,可以检取与用户的信息相关联的数据。例如,可以从聚合数据库检取所记录的与用户名称、账号或用户装置相关联的欺诈例项。与用户的信息相关联的数据可以是可用作风险模型或风险引擎的输入以便产生风险得分的数据。与用户相关联的风险数据的其它实例可包括先前申索历史、用户装置的位置、所上报的事故的位置、日时间、申索提交是在一周中的周几、上报更高补偿申索的倾向和/或声称更严重的健康状况的更高倾向。

在步骤S505,可以产生采访的初始得分。初始得分可以是可用于确定针对给定情形(即,针对正在进行的特定采访)的适当答复的任何值。在一个实施例中,初始得分可以是评定不准确或虚假信息存在于采访中的风险的风险得分。在另一实施例中,初始得分可以是情绪得分(例如,评定用户的挫折感水平的情绪得分)。

在步骤S506,可以基于采访的初始得分而确定采访脚本。采访脚本可以通过执行图形查询来确定,其中可以检取(即,基于用户输入的文本和初始得分)适合于当前对话的词语和短语的概念图。概念图的概念可包括可以用于描述采访的相关概念,如由语义决策表的逻辑所提供。例如,语义决策表可包括陈述以下的规则:对于涉及持卡人‘Rick’申索丢失/被盗***的高风险采访,应该发起‘采访脚本A:高风险’。在拓扑图(例如,概念图)中,‘高风险’、‘持卡人:Rick’和‘丢失/被盗’的输入节点可以通过边缘彼此相联系,并且可以进一步与采访脚本的输出节点相联系。在一个实施例中,可以通过查找图形中将节点(即,采访概念)与采访脚本相联系的最佳路径来确定适当的采访脚本,所述采访脚本含有对采访得分具有更大影响的问题(例如,引发显著增加或减少风险得分的答复的问题)。在一个实施例中,最佳路径可以使用蚁群优化算法来查找。

在步骤S507,可以将来自所确定的采访脚本的问题提供给用户。问题可以是针对用户输入的后续问题,它可以有助于澄清信息的准确性(例如,申索提交中的信息的准确性)。在一些情况下,用户可能故意提供虚假信息(例如,在欺诈的情况下)或者可能意外输入不正确的信息。在任一情况下,后续问题可以是可改变采访的初始得分以进一步推动决策并实现最佳结果(例如,仅允许真实信息被包括在所处理的申索中或阻止犯罪人员欺骗系统)的问题。

在步骤S508,可以接收用户的答复。用户答复可以含有一个或多个特征,所述特征可包括输入方法和/或用户答复所花费的时间。AI模型可以进一步使用一个或多个特征进行预测,例如评定的风险,它可以是与一个或多个特征(例如,存储在表格或树中)相关联(即,相联系)的数据。用户的答复和与一个或多个特征相关联的数据可以连同在步骤S502存储的数据一起存储在短期历史中。

在步骤S509,可以基于用户答复和存储在短期历史中的数据而产生后续得分。后续得分可以反映对采访评定的准确性或风险等级的当前状态。例如,用户答复可以含有错误输入的信息的澄清或修正,它可以使第二风险得分低于采访的初始风险得分。

在步骤S510,可以至少基于第二得分而更新采访脚本。例如,第二得分可以引起不同图形查询,并且可以含有用于确定适当采访脚本的不同概念。更新后的采访脚本可以含有可用于朝向期望方向推动采访的新问题或概念(例如,可以含有可以降低用户的挫折感水平的问题或答复)。

在步骤S511,可以基于第二得分提供采访脚本中的第二问题。在一个实施例中,第二问题可以由服务器计算机提供到采访者计算机。在另一实施例中,第二问题可以由采访者计算机或其操作者从采访脚本中选出。例如,采访脚本可以含有可供采访者计算机的操作者用于询问以下问题的概念图的概念:“太好了,您能稍等一下,让我们查一下您的信息吗?”。

根据本发明的实施例,可以基于用户答复产生采访的后续得分。后续得分可用于更新采访脚本,使得可以向用户提供允许他们澄清信息的后续问题。后续得分还可用于确定用户故意提供虚假信息,然后可能会产生连续采访脚本,其中用户可能会不停地接收问题,直到他或她终止采访为止。

图6示出根据本发明的实施例的自动申索提交系统的数据流图的绘图。数据流600可包括多个数据库,例如图形数据库603、短期历史608和聚合数据数据库609,所述数据库可以与数据一起进行更新和访问,所述数据例如是实时模式分析601、路径确定602、申索请求604、用户接口605、用户答复606、风险模型引擎607、欺诈数据610、实时数据提要611、其它外部数据612和模型构建环境613。

实时模式分析601可包括用于相对于路径确定602分析用户答复606的模式的指令。例如,用户可以在采访期间提交包括特定文本的对问题的答复,然后此文本可用于使用AI模型实时地确定图形中的路径。在路径确定602中确定的路径可以是从图形数据库603查询到的图形中的路径,例如使词语或短语(概念)与特定用户答复和其特征有关的概念图。可以使用查找图形中的最短路径的优化技术(例如,蚁群优化)来确定路径。所确定的路径可以是将与申索提交有关的概念的节点连接到指示欺诈概率的节点的路径。例如,查询到的图形可以是其中与具有极高补偿的医疗补助申索有关的输入节点与欺诈的输出节点高度连接的拓扑图。

在一个实施例中,实时学***(即,紧密相关的簇之间具有显著的风险得分差异),那么可以触发簇的申索签名风险因素的改变。

用户接口605可以是其中用户可以提交申索请求604并提交用户答复606的图形用户接口。例如,用户接口605可以是可在接受来自用户的文本的用户装置上显示的窗口,所述文本可接着提交到服务器计算机以在路径确定602中确定路径。用户接口可另外包括可用于执行输入方法分析的逻辑。例如,用户接口可包括用于检测键入输入之间的停顿并检测词语是否被复制并粘贴的代码。接着,输入方法分析可进一步影响所确定的或更新后的采访脚本。例如,用户答复的输入方法可以与AI模型可以用来产生风险得分并预测适当图形查询的一个或多个风险特征相关联。在一个实施例中,与如何输入数据有关的信息包可以是使用JavaScript开发的基于客户端的实时监控工具。从用户答复接收的数据可以存储在短期历史中,使得数据的特征可用作预测性模型(即,AI模型)的输入。

风险模型引擎607可包括用于确定评定与用户的信息或由用户输入的信息相关联的风险的风险得分的指令。与用户的信息或由用户输入的信息相关联的风险可以根据存储在短期历史中(例如,来自用户答复606)的用户信息和由用户输入的文本确定,并且可以使用AI模型确定。

可以在模型构建环境613中使用聚合数据数据库609中的训练数据创建AI模型。例如,学习算法可以使用欺诈数据610、实时数据提要611和其它外部数据612作为训练数据,并且可以训练AI模型以辨识用户答复中的模式,以便进行预测。欺诈数据610和实时数据提要611可以是从交易网络(例如,VisaNet)收集的数据,其中可以记录交易数据和其特征。例如,欺诈数据610可包括用于标记欺诈***易的数据,并且实时数据提要611可包括用于在消费者和商家之间进行的交易的数据。其它外部数据612可包括可以聚合以促进训练的任何其它数据,例如社交媒体数据或人口普查数据。

由所创建的AI模型做出的预测可用于确定与采访相关联的风险及确定图形中的路径,使得可以产生适当的采访脚本。在采访期间,用户答复可以另外存储在聚合数据数据库609中,使得可以更新AI模型。AI模型可接着辨识可用于确定或更新采访脚本的模式,并确定图形数据库603的图形内的最佳路径。因此,可以通过使用户难以预测针对每个用户答复606的后续问题的方式动态地产生采访脚本。

图7示出根据本发明的实施例的构建用于产生采访脚本的人工智能模型的数据流图。数据流700可包括一个或多个数据库,包括图形数据库701、模拟短期历史、聚合数据数据库707和修改后的图形数据库709,所述数据库可以与边缘文件产生702、实时模拟器703、采访结果数据统计705、用户答复数据统计706、模型构建图形708、学习算法710和外部数据711一起进行访问和更新。

根据本发明的实施例,系统700的元件可以受服务器计算机控制和/或利用,例如图3的服务器计算机300A。服务器计算机可以通过访问图形数据库701开始构建AI模型。图形数据库701可包括多个拓扑图。拓扑图可以是概念图,其中与采访脚本有关的概念可以通过边缘连接。例如,概念图可包括用户ID、申索类型和风险得分的节点,它们可以连接到可以包括在采访脚本中的各种词语或短语。下文在图8中进一步描述概念图的实例。

服务器计算机可以在边缘文件产生702中开始产生图形数据库701中的图形的边缘。边缘文件产生可包括用于连接拓扑图中的相关节点的指令。例如,边缘文件产生可包括用于将与申索提交有关的各种概念或数据的节点联系在一起以便构建可用于确定采访脚本的概念图的代码。

图形中的边缘可以基于与采访有关的数据而产生,例如与申索提交有关的数据。数据可以从聚合数据数据库707收集,所述聚合数据数据库707中可以聚合采访数据和外部数据711。收集到的数据可用于确定采访结果数据统计705和用户答复数据统计706。例如,聚合数据数据库可包括与采访在识别欺诈中是否结束、对真实提交的申索的识别或采访的任何其它可能结果有关的数据,并且可另外包括与关于用户答复的信息有关的数据,例如用户答复是增加还是减少了采访的风险得分。

采访结果数据统计705和用户答复数据统计706可以被馈送到实时模拟器中,其中从采访收集的信息可用于产生序列图形。序列图形可以是其中节点序列可以进行截尾以形成规则的图形。每个规则都可以是图形中的路径,它将与采访数据有关的节点与可用于确定适当采访脚本的概念的节点相联系。例如,序列图形可包括节点路径,其中‘持卡人:Rick’、‘高风险’和‘卡丢失/被盗’的节点可以与‘采访脚本A’联系在一起。序列图形的数据可以存储在模拟短期历史704中,使得序列路径可用于模拟潜在采访可以如何结束。

如果产生的序列图形包括新规则,那么新规则的序列路径可以结束。新规则可用于构建用于确定动态采访脚本的AI模型。模型构建图形708可以基于从实时模拟器703确定的新规则以及来自修改后的图形数据库709的数据和学习算法710而构建AI模型。学习算法710可包括学习算法,其中采访的特征可用于确定图形中的最佳路径。图形的最佳路径可以记录在图形数据库709中。

根据本发明的实施例,AI模型可用于确定可以防止不准确的信息被包括在所处理的申索中或者可以阻止犯罪人员欺骗申索提交系统的采访脚本。例如,使用系统700产生的AI模型可以是检测申索提交中的特征以便预测可有助于识别用户是否撒谎的采访脚本的AI模型,所述特征例如是申索类型、与申索的输入方法有关的特征,以及与用户相关联的风险等级。AI模型可以通过识别查询到的图形中的路径来预测适当的采访脚本,其中采访中的申索数据可以基于所学习的规则与特定的一组词语或短语相联系。

图8示出根据本发明的实施例的概念图中节点的路径的实例。根据本发明的实施例,图形可以是用于确定采访脚本的概念图,并且可以在动态采访过程期间(例如,在申索提交期间)从图形数据库中查询。使用例如概念图的拓扑图以确定采访脚本的优势在于,概念之间的关系(例如,申索数据和风险等级之间的关系)可以进行学习和重新评估,并且可以确定图形内的最佳路径以达到所要结果(例如,防止在所处理的申索中提交不准确的信息)。这不同于根据硬编码表或树确定采访问题,因为可以随着学习的进行在评估连接时确定更合适的问题。

实例路径800可包括一组节点,例如节点801:‘持卡人:Rick 801’、节点802:‘申索’、节点803:‘丢失/被盗’、节点804:‘开始’、节点805:‘脚本:A.Point1’、节点806:‘发起’、节点807:‘脚本:A.Point1.高风险’、节点808:‘高风险’、节点809:‘是’,和节点810:‘发起’。在示出的概念图中,概念的节点可以示出为矩形,且将概念相联系的概念关系的节点可以示出为圆形。

在采访期间,与用户相关联的数据和与由用户提交的申索相关联的数据可以由服务器计算机(例如,图3的服务器计算机300A)接收。数据可用于执行图形查询,其中可以检取包括与数据有关的节点的概念图。根据概念图,可以确定适用于的采访的当前状态的采访脚本。

例如,在采访期间,用户可以提交对被盗***的申索。可以使用包括单独子模块的分层建模架构的AI模型来确定与用户和输入的申索相关联的数据。例如,可以使用神经网络来确定与用户的IP地址和装置ID相关联的通信风险因素,并且与由用户输入的数据相关联的风险因素可以使用通过无监督学习(例如,聚类)建立的风险预测(risk profile)来确定。可以进一步从与用户和输入的申索相关联的数据确定采访的风险得分。例如,在服务器计算机上运行的风险评分引擎可以获得用户的所存储历史和与申索相关联的风险特征作为输入,并且可以基于在交易处理网络中执行的风险建模输出风险得分。

基于风险得分及与用户和提交的申索相关联的数据,可由服务器计算机执行图形查询。查询到的图形可以是包括实例路径800的概念图。接着,实例路径800可用于发起采访脚本。对于包括‘持卡人:ABC’申索‘丢失或被盗’的卡的申索,可以发起‘脚本:A.Point1’。‘脚本:A.Point1’可以是可包括一个或多个用于从用户接收额外信息的答复或后续问题的初始采访脚本。例如,初始采访脚本可包括以下:“请输入:事故的日时间和精确位置”。

采访脚本的答复可以从采访者计算机发送到用户的装置,用户可接着输入包括额外信息的用户答复(例如,用户输入所上报的事故的日时间和精确位置)。然后,额外信息可改变计算出的采访的风险得分,并且可以产生更新后的采访脚本。例如,用户可以输入先前在欺诈性申索提交中使用的日时间和精确位置,这可能会使风险得分变成‘高风险’。采访脚本可接着进行更新,并且可包括可以从用户提取其它信息的额外后续答复。例如,更新后的采访脚本接着可以包括以下问题:“您通知警察了吗?如果是,请输入联系信息;您为什么在该地点?;您是否通知了周围商户?”

根据本发明的实施例,可以产生使用AI模型确定的采访脚本,使得只有准确信息可以包括在所处理的申索中。例如,确定与不准确或虚假信息的高风险相关联的采访可能会产生含有更积极问询的连续采访脚本。如果采访的风险得分继续增加或保持在高水平,那么可以向用户不断地发送后续问题,直到他或她退出采访为止。如果用户开始澄清信息使得信息准确,或如果用户开始以确定为真正(如通过所学习的模式所辨识)的方式动作,那么采访的风险得分可以下降。如果风险得分减小到低于预定义阈值,那么用户可以被引导真人采访,其中人类代表可以处理用户提交的申索。

本发明的实施例提供优于现有技术的数个技术优势。用于产生采访脚本的先前方法只涉及产生用于每个情形的静态脚本。在先前方法中,每个脚本或答复映射为静态决策,并且犯罪人员能够通过学习什么类型的答复会产生达到他们所要结果的一组决策(例如,处理欺诈性申索)来欺骗系统。相比之下,本发明的实施例利用可以在采访期间不断学习的AI模型,所述AI模型可用于以用户难以预测的方式动态地改变采访脚本。此外,在其它申索提交过程中,用户和采访者方面的人为差错可能会产生非所要结果。例如,令人混淆的用户接口可能会使用户不正确地输入信息,或训练不佳的采访者可能会用令用户受挫的方式与用户互动。本发明的实施例通过评分和建模来一直评估采访的状态,从而补救这些问题,这可以提供专门用于澄清信息并推动采访朝着所要结果前进的问题。

本文提到的任何计算机系统可以利用任何合适数目个子系统。在图2中示出计算机设备202、210和220中的此类子系统的实例。在一些实施例中,计算机系统包括单个计算机设备,其中子系统可以是计算机设备的组件。在其它实施例中,计算机系统可以包括具有内部组件的多个计算机设备,每个计算机设备都是子系统。计算机系统可以包括台式电脑和笔记本电脑、平板电脑、移动电话和其它移动装置。

图2所示的子系统可以通过系统总线互连。示出了耦合到显示适配器的额外子系统,例如打印机、键盘、存储装置、监视器等。耦合到输入/输出(I/O)控制器的***设备和I/O装置可以通过本领域已知的任何数量的连接,如输入/输出(I/O)端口(例如,USB、)连接到计算机系统。例如,I/O端口或外部接口(例如,以太网、Wi-Fi等)可用于将计算机系统连接到例如因特网的广域网、鼠标输入装置或扫描仪。经由系统总线的互连允许中央处理器与每个子系统进行通信,并控制来自系统存储器或存储装置(例如,固定盘,诸如硬盘驱动器,或光盘)的多个指令的执行,以及子系统之间的信息交换。系统存储器和/或存储装置可以体现计算机可读介质。另一子系统是数据收集装置,例如相机、麦克风、加速度计等等。本文所提及的任何数据都可以从一个组件输出到另一组件,并且可以输出给用户。

计算机系统可以包括例如通过外部接口或通过内部接口连接在一起的多个相同组件或子系统。在一些实施例中,计算机系统、子系统或设备可以通过网络通信。在此类情况下,一个计算机可视为客户端,且另一计算机可视为服务器,其中每台计算机可以是同一计算机系统的一部分。客户端和服务器可以各自包括多个系统、子系统或组件。

实施例的各个方面都可以使用硬件(例如,专用集成电路或现场可编程门阵列)和/或使用计算机软件以控制逻辑的形式实施,其中通用可编程处理器是模块式的或集成式的。如本文中所使用,处理器包括单核处理器、在同一集成芯片上的多核处理器,或在单个电路板上或网络化的多个处理单元。基于本公开和本文中所提供的教示,本领域的普通技术人员将知道并且了解使用硬件及硬件与软件的组合来实施本发明的实施例的其它方式和/或方法。

本申请中所描述的任何软件组件或功能可被实施为要使用例如Java、C、C++、C#、Objective-C、Swift的任何合适计算机语言或例如Perl或Python的脚本语言,使用例如常规的或面向对象的技术由处理器执行的软件代码。软件代码可以存储为计算机可读介质上的一系列指令或命令以用于存储和/或传输。适合的非暂时性计算机可读介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、磁介质(例如硬盘驱动器或软盘)或光介质(例如,压缩光盘(CD)或DVD(数字通用盘))、闪存等。计算机可读介质可以是此类存储或传输装置的任何组合。

此类程序还可以使用适应于经由包括因特网的符合多种协议的有线、光学和/或无线网络进行传输的载波信号来编码和传输。因此,可以使用以此类程序编码的数据信号来创建计算机可读介质。以程序代码编码的计算机可读介质可与兼容装置一起封装或与其它装置分开地提供(例如,经由因特网下载)。任何此类计算机可读介质可以驻留于单个计算机产品(例如,硬盘驱动器、CD或整个计算机系统)之上或之内,且可存在于系统或网络内的不同计算机产品之上或之内。计算机系统可以包括用于将本文中所提及的任何结果提供给用户的监视器、打印机或其它合适的显示器。

本文中所描述的任何方法可以完全或部分地用计算机系统来执行,所述计算机系统包括可配置成执行步骤的一个或多个处理器。因此,实施例可以涉及配置成执行本文中所描述的任何方法的步骤、可能具有执行相应步骤或相应步骤群组的不同组件的计算机系统。尽管以带编号的步骤呈现,但是可以同时或以不同的顺序执行本文中的方法的步骤。另外,这些步骤的部分可以与其它方法的其它步骤的部分一起使用。此外,步骤的全部或部分可以是任选的。另外,任何方法的任何步骤都可以用执行这些步骤的模块、单元、电路或其它构件来执行。

在不偏离本发明的实施例的精神和范围的情况下,具体实施例的特定细节可以以任何适当方式组合。然而,本发明的其它实施例可以涉及与每个个别方面或这些个别方面的特定组合有关的特定实施例。

上文对本发明的实例实施例的描述已经出于说明和描述的目的呈现。它不希望是详尽的,或将本发明限于所描述的精确形式,并且根据上文的教示,许多修改和变化是可能的。

除非明确指示有相反的意思,否则叙述“一个/种”或“所述”旨在表示“一个/种或多个/种”。除非明确指示有相反的意思,否则“或”的使用旨在表示是“包括性的或”,而不是“排他性的或”。提到“第一”组件并不一定要求提供第二组件。而且,除非明确指出,否则提到“第一”或“第二”组件并不将提到的组件限制到特定位置。

本文中提到的所有专利、专利申请、公开和描述出于所有目的以全文引用的方式并入本文中。不承认它们是现有技术。

32页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于医学和一般诊断的全自动数据分析、报告和量化以及用于数字化图像中的边缘检测的系统和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!