商品协同推荐方法及其装置、设备、介质、产品

文档序号:1937704 发布日期:2021-12-07 浏览:25次 >En<

阅读说明:本技术 商品协同推荐方法及其装置、设备、介质、产品 (Commodity collaborative recommendation method and device, equipment, medium and product thereof ) 是由 黄丕帅 于 2021-09-26 设计创作,主要内容包括:本申请公开一种商品协同推荐方法及其装置、设备、介质、产品,所述方法包括:获取商品数据库中的商品对象相对应的多个行为类型的交互行为数据,其中至少一个行为类型与其他行为类型有业务逻辑上的先后关系;统计两两商品对象之间各个行为类型相对应的共有用户总量;计算两两商品对象之间的相似度数据,所述相似度数据为根据相应的两个商品对象的各个行为类型的共有用户总量计算确定的相似度的和值;响应商品匹配指令,根据所述相似度数据为该指令指定的目标商品对象查询确定其相应的若干个相似商品对象。本申请能够提升推荐给用户的相似商品对象的匹配度,更加匹配用户真实需求,使相似商品对象获得更高的点击率。(The application discloses a commodity collaborative recommendation method and a device, equipment, a medium and a product thereof, wherein the method comprises the following steps: acquiring interactive behavior data of a plurality of behavior types corresponding to the commodity objects in the commodity database, wherein at least one behavior type has a business logic precedence relationship with other behavior types; counting the total amount of the users corresponding to each behavior type between every two commodity objects; calculating similarity data between every two commodity objects, wherein the similarity data is a sum of similarity determined by calculation according to the total amount of users sharing each behavior type of the corresponding two commodity objects; and responding to the commodity matching instruction, and inquiring and determining a plurality of corresponding similar commodity objects for the target commodity object specified by the instruction according to the similarity data. The matching degree of the similar commodity objects recommended to the user can be improved, the real requirements of the user can be matched better, and the similar commodity objects can obtain higher click rate.)

商品协同推荐方法及其装置、设备、介质、产品

技术领域

本申请涉及电商信息技术领域,尤其涉及一种商品协同推荐方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

背景技术

电商推荐系统业界主要分为召回和排序两个阶段,在召回阶段,往往又以多路召回方案为主。协同过滤作为其中最经典的召回方案,使用用户ID和商品ID交互行为进行推荐,能够很好的反映用户的个性化召回。

但是,传统协同过滤只使用ID特征进行相似商品召回,通常是基于ID进行商品画像或用户画像,根据画像标签实现商品匹配,这种情况下,忽视了对用户具体行为信息的开发和利用,而实践中,用户和商品的不同交互行为表达了对物品的不同意图,例如一个用户点击某个商品,更适合的场景是向其推荐相似商品,如果用户购买过这个商品,则更适合向其推荐这个商品的相关商品。据此,申请人认为,用户的点击、加购、下单、支付等交互行为具有不同的含义,可以对其进一步进行数据挖掘,对挖掘后的信息进行二次利用。

有鉴于此,电商平台中的商品选品相关的技术仍有挖掘的空间,本申请人长期专注于相关领域的研发,因而对此做出相应的探索。

发明内容

本申请的首要目的在于解决上述问题至少之一而提供一种商品协同推荐方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。

为满足本申请的各个目的,本申请采用如下技术方案:

适应本申请的目的之一而提供的一种商品协同推荐方法,包括如下步骤:

获取商品数据库中的商品对象相对应的多个行为类型的交互行为数据,其中至少一个行为类型与其他行为类型有业务逻辑上的先后关系;

根据实施相同行为类型而产生同类交互行为数据的相同用户数量,统计两两商品对象之间各个行为类型相对应的共有用户总量;

计算两两商品对象之间的相似度数据,所述相似度数据为根据相应的两个商品对象的各个行为类型的共有用户总量计算确定的相似度的和值;

响应商品匹配指令,根据所述相似度数据为该指令指定的目标商品对象查询确定其相应的若干个相似商品对象。

深化的实施例中,获取商品数据库中的商品对象相对应的多个行为类型的交互行为数据,包括如下步骤:

获取商品数据库中的商品对象相对应的用户历史行为数据;

对所述用户历史行为数据进行数据清洗,确定每个商品对象相对应的多个行为类型的交互行为数据,相应包括作用于商品对象的点击行为数据与如下至少任意一项:商品对象被添加到购物车的加购行为数据、商品对象的下单行为数据、商品对象的订单的支付行为数据。

深化的实施例中,计算两两商品对象之间的相似度数据,包括如下步骤:

基于各个行为类型,确定两两商品对象之间的关于该行为类型的相似度;

应用预设的权重匹配方案,将两两商品对象的多个共有行为类型的相似度进行加权求和,获得两两商品对象之间的相似度数据;

构造用于存储所述相似度数据的相似度矩阵,其中每个元素用于存储其行坐标所指向的商品对象与其列坐标所指向的商品对象之间的相似度数据;

对相似度矩阵中的相似度数据进行归一化。

较佳的实施例中,基于各个行为类型,确定两两商品对象之间的关于该行为类型的相似度的步骤中,采用如下任意一种算法进行相似度计算:余弦相似度算法、欧式距离算法、皮尔逊相关系数算法、杰卡德算法、对数似然算法、曼哈顿距离算法。

较佳的实施例中,应用预设的权重匹配方案的步骤中,所述权重匹配方案被配置为按以下排序自小至大匹配权重:点击行为数据、加购行为数据、下单行为数据、支付行为数据。

深化的实施例中,响应商品匹配指令,根据所述相似度数据为该指令指定的目标商品对象查询确定其相应的若干个相似商品对象,包括如下步骤:

查找出与所述目标商品对象映射到所有商品对象的相似度数据;

根据所述相似度数据进行倒排序;

从排序结果中选取设定数量的若干个相似度数据最大的相似商品对象;

将所述相似商品对象推送给触发所述商品匹配指令的用户。

适应本申请的目的之一而提供的一种商品协同推荐装置,包括:数据获取模块、总量统计模块、相似度计算模块,以及响应推荐模块,其中,所述数据获取模块,用于获取商品数据库中的商品对象相对应的多个行为类型的交互行为数据,其中至少一个行为类型与其他行为类型有业务逻辑上的先后关系;所述总量统计模块,用于根据实施相同行为类型而产生同类交互行为数据的相同用户数量,统计两两商品对象之间各个行为类型相对应的共有用户总量;所述相似度计算模块,用于计算两两商品对象之间的相似度数据,所述相似度数据为根据相应的两个商品对象的各个行为类型的共有用户总量计算确定的相似度的和值;所述响应推荐模块,用于响应商品匹配指令,根据所述相似度数据为该指令指定的目标商品对象查询确定其相应的若干个相似商品对象。

深化的实施例中,所述数据获取模块包括:历史数据获取子模块,用于获取商品数据库中的商品对象相对应的用户历史行为数据;数据清洗子模块,用于对所述用户历史行为数据进行数据清洗,确定每个商品对象相对应的多个行为类型的交互行为数据,相应包括作用于商品对象的点击行为数据与如下至少任意一项:商品对象被添加到购物车的加购行为数据、商品对象的下单行为数据、商品对象的订单的支付行为数据。

深化的实施例中,所述相似度计算模块包括:行为计算子模块,用于基于各个行为类型,确定两两商品对象之间的关于该行为类型的相似度;加权计算子模块,用于应用预设的权重匹配方案,将两两商品对象的多个共有行为类型的相似度进行加权求和,获得两两商品对象之间的相似度数据;矩阵构造子模块,用于构造用于存储所述相似度数据的相似度矩阵,其中每个元素用于存储其行坐标所指向的商品对象与其列坐标所指向的商品对象之间的相似度数据;矩阵归一化子模块,用于对相似度矩阵中的相似度数据进行归一化。

较佳的实施例中,所述行为计算子模块被配置为采用如下任意一种算法进行相似度计算:余弦相似度算法、欧式距离算法、皮尔逊相关系数算法、杰卡德算法、对数似然算法、曼哈顿距离算法。

较佳的实施例中,所述加权计算子模块中,所述权重匹配方案被配置为按以下排序自小至大匹配权重:点击行为数据、加购行为数据、下单行为数据、支付行为数据。

深化的实施例中,所述商品推荐模块包括:相似查询子模块,用于查找出与所述目标商品对象映射到所有商品对象的相似度数据;结果排序子模块,用于根据所述相似度数据进行倒排序;相似选取子模块,用于从排序结果中选取设定数量的若干个相似度数据最大的相似商品对象;相似推荐子模块,用于将所述相似商品对象推送给触发所述商品匹配指令的用户。

适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的商品协同推荐方法的步骤。

适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的商品协同推荐方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。

适应本申请的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述方法的步骤。

相对于现有技术,本申请的优势如下:

本申请对用户行为数据的数据挖掘深入到具体行为类型的层面,根据不同行为类型对两两商品对象之间的共有用户总量进行统计,所述共有用户总量表征了该两个商品对象之间被实施相同行为类型的交互行为的用户总量,进而针对各个行为类型,根据共有用户总量统计两两商品对象之间的相似度,最后汇总两两商品对象之间的多个行为类型的相似度获得两两商品对象之间的相似度数据,此一相似度数据在宏观上继承了各个具体行为类型之间的逻辑关联信息,体现了两两商品对象之间的深度关联,在此基础上,利用该相似度数据为一个商品对象匹配相似商品对象,更匹配用户需求逻辑,使用户更容易直达其真实需求相对应的商品,进一步还能提升所推荐的相似商品对象的点击率和成交率。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本申请的商品协同推荐方法的典型实施例的流程示意图;

图2为本申请实施例获取交互行为数据的过程的流程示意图;

图3为本申请实施例中计算相似度数据的过程的流程示意图;

图4为本申请实施例中查询相似商品对象的过程的流程示意图;

图5为本申请的商品协同推荐装置的原理框图;

图6为本申请所采用的一种计算机设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。

本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。

需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。

本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。

本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。

本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。

本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。

本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。

本申请的一种商品协同推荐方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如在本申请的电商平台应用场景中,一般部署在服务器中实施,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。

请参阅图1,本申请的商品协同推荐方法在其典型实施例中,包括如下步骤:

步骤S1100、获取商品数据库中的商品对象相对应的多个行为类型的交互行为数据,其中至少一个行为类型与其他行为类型有业务逻辑上的先后关系:

以基于独立站的跨境电商平台为例,每个商家实例均拥有一个商品数据库,用于存储其发布上线的商品对象的商品信息,包括但不限于商品对象相应的标题文本、分类标签、属性数据、详情文本、图片、视频等不同类型的信息。用户访问该独立站中的商品对象时,通过触发用户所在的终端设备的相应页面或应用程序中预置的埋点代码的运行,会触发向独立站提交用户行为消息,将用户所实施的行为类型及其所作用的数据对象的关联关系信息提交给独立站的服务器,由此服务器便可获得相应的交互行为数据。例如,用户点击一个商品对象进入其详情页面时,埋点代码可以获知相应的点击行为以及被作用的商品对象,而将其组织为关联关系信息,封装成交互行为数据提供给服务器解析获取。同理,用户进一步在该详情页面点击购买控件实施下单时,相应的埋点代码也可识别获得用户的下单行为及被下单的商品对象,而构造成相应的交互行为数据提交给服务器。其他行为类型诸如用户追加商品对象购买量的加购行为、用户执行某一商品对象的订单的支付行为等,也与此同理,可在后台自动生成相关交互行为数据。

此外的另一种实施例中,服务器也可根据用户点击链接拉取相应的页面时,根据具体页面倒推用户所触发的行为类型,从而自行确定用户相应的行为类型及其相应的数据对象,生成表征行为类型与其所作用的数据对象的关联关系信息相应的交互行为数据。例如,用户点击一个商品对象时,会拉取该商品对象的详情页面,服务器据此可确认用户的实施作用于该商品对象的点击行为,而获得相应的交互行为数据。同理,用户进一步点击该商品对象的购买控件时,后台便会生成相应的作用于该商品对象的下单行为的交互行为数据。其他行为类型诸如用户追加商品对象购买量的加购行为、用户执行某一商品对象的订单的支付行为等,也与此同理,可在后台自动生成相关交互行为数据。

用户实施对商品对象的交互行为所涉及的行为类型,包括但不限于如下几种:点击行为类型、下单行为类型、加购行为类型、支付行为类型。所述的点击行为类型主要是指用户点击一个商品对象进入其详情页面以便实施下单的行为类型,所述下单行为类型是指用户触发商品对象的下单逻辑的行为类型,所述加购行为类型是指用户将商品对象添加到购物车的行为类型,所述支付行为类型是指用户针对商品对象已创建的订单成功执行支付相对应的支付行为类型。

不难看出,各个行为类型相对应的用户行为事件,构成了关于商品对象购买行为的一条完整的业务链,例如,用户要购买一个商品时,首先在页面上点击相应的商品对象进入其详情页面,由此触发生成点击行为类型的交互行为数据,也即点击行为数据;然后将其添加到购物车,由此触发生成加购行为类型的交互行为数据,也即加购行为数据;继而在购物车中可以直接下单以创建商品对象相应的订单,而触发生成下单行为类型相对应的交互行为数据,即下单行为数据;最后,用户对相应的账单执行付款操作,相应触发生成支付行为类型的交互行为数据,即支付行为数据。

针对该业务链,根据电商平台常见的业务逻辑,通常也允许用户跨越添加到购物车的环节,而直接在详情页面上执行下单行为;用户有时虽然将商品对象添加至购物车中,但也可能长期不实施下单行为和支付行为。或者即使实施了下单行为,也可能长期不实施支付行为。也即是说,尽管本申请考虑了整个用户购买过程相对应的业务逻辑所涉及的各种行为类型,也即在较佳的情况下将针对每个商品对象获取其被用户购买的业务流程全链条所涉及的所有行为类型相对应的交互行为数据,但是,并不构成对本申请可实施方案的限定,本申请允许采用整个业务链条中的部分行为类型相对应的交互行为数据来实施,例如,采用所述点击行为类型和其他行为类型其中之一亦可。概括而言,本申请希望针对每个商品对象采集用户针对该商品对象所实施的至少两个行为类型相对应的交互行为数据作为数据挖掘所需的基础数据。由于所述点击行为类型对应的正是商品对象的入口,即通过第一界面上点击商品对象,便可进入其详情页面以便实施后续下单流程,因此,本典型实施例中,所获取的交互行为数据,至少应包括所述的点击行为类型及以下行为类型任意之一:加购行为类型、下单行为类型、支付行为类型。但是,某些变通的实施例中,也可以是诸如仅包括下单行为类型、支付行为类型两种。或者仅包括点击行为类型、下单行为类型、支付行为类型三种亦可。除此之外,也可根据数据挖掘深度的需要而扩展其他行为类型,例如用户将商品对象分享给其他用户的分享行为类型等,也可获取其相应的交互行为数据作为本申请的数据挖掘之用。

因此,可以概括理解,本申请所采用的交互行为数据所涉及的行为类型,在业务逻辑上存在先后关系,包括紧接发生的直接相继关系,也包括非紧接发生的间接相继关系。由此,本申请可以利用这种先后关系,挖掘出用户行为相对应的逻辑信息和用户意图决策信息,以便后续据此确定出相似度矩阵,服务于商品推荐之用。

需要注意的是,本申请尽管强调了多个行为类型之间存在业务逻辑上的相继关系,在较佳的情况下,可以优先采用针对商品对象实施了完整的业务逻辑内所有指定行为类型的用户相对应的交互行为信息,但是,不应将其反向窄化理解为单个用户必须针对具体商品对象完整地实施该业务逻辑上的所有行为类型,因为,本申请在数据挖掘时,其针对的对象主要是商品对象,而非用户本身,因此,只要商品对象相对应的交互行为数据包含这种行为类型上的相继关系,则这些交互行为数据便在大数据层面上宏观地体现了商品对象被购买过程的关联信息,即可被本申请所挖掘利用。

服务器采用的交互行为数据被长期积累存储在后台,将这些交互行为数据调取出来,以便运用统计手段开始对其进行数据挖掘。一般而言,在进行数据获取时会给定一个历史时间段,以便为每个商品对象筛选出属于该历史时间段范围内的交互行为数据集,这一历史时间段一般是以实施本申请当天回溯的时间段。例如设定所述的历史时间段为三个月,则意味着只筛选出实施本申请之日开始回溯三个月获得该三个月期间产生的所述交互行为数据。当然,这一历史时间段是由本领域技术人员灵活设定的,视乎对信息时效的需求而定。该历史时间段也可以是一个月、半个月、一周等,均可按需设定。

步骤S1200、根据实施相同行为类型而产生同类交互行为数据的相同用户数量,统计两两商品对象之间各个行为类型相对应的共有用户总量:

获得所述历史时间段的交互行为数据集之后,便可启动统计工作,针对每两个所述的商品对象,对应各个行为类型统计两两商品对象之间的共有用户总量。

每个商品对象其所关联的交互行为数据,来源于多个用户,在统计共有用户总量的阶段,与单个用户实施的行为类型的多少无关,因此,一般无需考虑用户是否完整地实施整个业务逻辑所构成的业务链的所有行为类型,除非适应个别实施例的需要对此做出变通之外。

具体统计时,当两个商品对象分别被相同的一个用户实施了相同行为类型的交互行为时,即两个商品对象之间存在相同交互行为相对应的交互行为数据时,便为该相同行为类型的共有用户总量累加1,最终统计得到所有行为类型相对应的共有用户总量,每个行为类型相对应的共有用户总量在统计意义上表征该两个商品对象中的每个商品对象被身份相同的多少个用户实施了同一相应交互行为,例如,两个商品对象中的第一个商品对象,其被Nf,i个用户实施了X1次点击交互行为,其中f表示特定的交互行为即点击交互行为,i表示第一个商品对象;第二商品对象,其被Nf,j个用户实施了X2次点击交互行为,其中j表示第二商品对象。这种情况下,求取两个用户群的交集Nf,i∩Nf,j,得到相同用户的总量Nf,即为与点击行为事件相对应的该两两商品对象之间的共有用户总量。其中可见,统计过程中并不考虑X1与X2这两个数据,也即,对于相同用户针对同一商品对象实施的多次点击行为,实质上被等同于一次点击行为看待。其他行为类型相对应的共有用户总量的统计也与此同理。推而广之,商品数据库中的所有商品对象,两两之间均可以获得各个行为类型相对应的共有用户总量。

至此可以看出,所述的共有用户总量,建立起两两商品对象关于相同用户群体的相同交互行为之间的关联信息,由于用户针对同一商品对象所实施的交互行为可能涵盖多个行为类型,因此,不同商品对象组件的共有用户总量之间,又隐含了业务逻辑链条中跨行为类型的交互行为之间的关联信息,由此,实现了对用户所产生的交互行为数据所隐含的业务逻辑上的关联信息的高效表示。

两两商品对象中,每个行为类型相对应的共有用户总量Nf,表示有Nf个共同用户对该两个商品对象都实施了相同行为类型的交互行为,因此,不同行为类型之间的共有用户总量可能呈现差异。示例而言,设点击行为类型相对应的共有用户总量为Cn,所述加购行为类型相对应的共有用户总量为An,所述下单行为类型相对应的共有用户总量为On,所述支付行为类型相对应的共有用户总量为Pn,结合实践经验和简单逻辑推理可知,一般而言,Cn>An>On>Pn。当然,也并不绝对,如果用户不习惯将商品对象添加至购物车,而是直接下单购买,则An未必大于On和Pn。由此可以看出,同一对商品对象的各个共有用户总量之间,确实携带了电商平台上相同用户不同交互行为之间的逻辑关系信息,在宏观上体现了各行为类型之间的关联关系。

为了便于计算,可以将所述共有用户总量构造为矩阵,以方便后续进行矩阵操作,直接调用两两商品对象之间的各个类型的共有用户总量。所述矩阵可以为二维矩阵或者三维矩阵,以二维矩阵为例,针对每个行为类型可以建立一个矩阵,该矩阵的行坐标与列坐标均按序指代商品数据库中的各个商品对象,由此,构成一个方阵,其中每个元素即用于存储其行坐标和列坐标分别指向的两个商品对象之间的共有用户总量,后续通过引用这个二维矩阵的元素,便可获得相应的两个商品对象关于该行为类型的共有用户总量。

步骤S1300、计算两两商品对象之间的相似度数据,所述相似度数据为根据相应的两个商品对象的各个行为类型的共有用户总量计算确定的相似度的和值:

在前述过程中实现了对两两商品对象之间的关联信息的数据挖掘,相应的关联信息被隐含在两两商品对象的关于各个行为类型的共有用户总量中,在此基础上,便可引用共有用户总量来计算两两商品对象之间的相似度,获得相似度数据,以便通过该相似度数据进一步反映两两商品对象之间在用户购买商品对象的业务逻辑上的关联,方便通过引用相似度数据进行为某一目标商品对象确定其相似的其他商品对象。

计算数据之间相似度的方式,本领域技术人员可以采用多种公知的算法来实现,包括但不限于如下任意一种:余弦相似度算法、欧式距离算法、皮尔逊相关系数算法、杰卡德算法、对数似然算法、曼哈顿距离算法。当然,由于存在多个行为类型相对应的向量矩阵,因此,在适用相似度算法计算的过程中,适宜针对每一个行为类型,引用其两两商品对象之间的共有用户总量,来计算该两个商品对象之间关于该行为类型的相似度,然后再将这些相似度进行加总获得和值实现融合,该和值即为该两两商品对象之间最终确定的相似度数据。

为便于引用所述的相似度数据,同理可建构一个二维矩阵,该矩阵的行坐标与列坐标均按序指代商品数据库中的各个商品对象,由此,构成一个方阵,其中每个元素即用于存储其行坐标和列坐标分别指向的两个商品对象之间的相似度数据,后续通过引用这个二维矩阵的元素,便可获得相应的两个商品对象关的相似度数据。可以理解,其中每一个行向量,即存储一个商品对象与商品数据库中所有商品对象之间的相似度数据,当要确定某一商品对象的相似商品对象时,从其行向量中进行相似度匹配即可。

步骤S1400、响应商品匹配指令,根据所述相似度数据为该指令指定的目标商品对象查询确定其相应的若干个相似商品对象:

当电商平台的后台服务器需要根据所述的相似度数据为每一目标商品对象生成其相似商品对象的列表时,可以下达商品匹配指令来实现。或者,也可由商家实例的消费者用户来下达所述的商品匹配指令,以驱动服务器为之确定该用户正在访问的目标商品对象相对应的相似商品对象,将这些相似商品对象推送给该用户。

当下达所述的商品匹配指令时,后台服务器响应该商品匹配指令,在所述存储相似度数据的二维矩阵中调用与该指令所指定的目标商品对象相对应的行向量(或列向量),然后对应获得其中各个元素的列坐标所指向的商品对象,根据各元素的相似度数据对这些商品对象进行排行后择优作为相似商品对象,即完成了对该指令所指定的目标商品对象的相似商品对象的匹配过程,最终可将这些相似商品对象推送给相关用户。

通过本典型实施例的揭示可知,本申请对用户行为数据的数据挖掘深入到具体行为类型的层面,根据不同行为类型对两两商品对象之间的共有用户总量进行统计,所述共有用户总量表征了该两个商品对象之间被实施相同行为类型的交互行为的用户总量,进而针对各个行为类型,根据共有用户总量统计两两商品对象之间的相似度,最后汇总两两商品对象之间的多个行为类型的相似度获得两两商品对象之间的相似度数据,此一相似度数据在宏观上继承了各个具体行为类型之间的逻辑关联信息,体现了两两商品对象之间的深度关联,在此基础上,利用该相似度数据为一个商品对象匹配相似商品对象,更匹配用户需求逻辑,使用户更容易直达其真实需求相对应的商品,进一步还能提升所推荐的相似商品对象的点击率和成交率。

请参阅图2,深化的实施例中,所述步骤S1100、获取商品数据库中的商品对象相对应的多个行为类型的交互行为数据,包括如下步骤:

步骤S1110、获取商品数据库中的商品对象相对应的用户历史行为数据:

如前所述,用户在电商平台中时,将触发生成相应的交互行为数据,后台服务器在获得这些交互行为数据之后,将其存储到相应的数据库中,由此构成用户历史行为数据。

为了服务于本申请的技术方案,需要从这些数据为中调用所述的用户历史行为数据,并且,通常会先根据给定的历史时间段来筛选属于该历史时间段的数据,例如前述的三月、一月、半月、一周相对应的历史时间段的历史行为数据。对此,本领域技术人员可灵活实施。

步骤S1120、对所述用户历史行为数据进行数据清洗,确定每个商品对象相对应的多个行为类型的交互行为数据,相应包括作用于商品对象的点击行为数据与如下至少任意一项:商品对象被添加到购物车的加购行为数据、商品对象的下单行为数据、商品对象的订单的支付行为数据:

所述的用户历史行为数据在存在时是针对每一次用户行为触发的用户行为消息相对应产生交互行为数据后存储的,是相对离散和多样化的,因此,需要对其进行数据清洗。

其中的一个手段是去除与本申请所需数据无关的相关行为数据,只保留本申请需要引用的行为类型相关的交互行为数据,这些交互行为数据一般包括用户特征信息、商品对象、行为类型、时间之间映射关系信息,据此才方便施加本申请的各个步骤相对应的技术手段。

另一个手段可以是对同一用户针对同一商品对象实施相同行为类型相对应的交互行为数据进行聚类。由于如前所述,本申请主要是为了统计两两商品对象之间关于相同行为类型的共有用户总量,对于单一用户在同一商品对象上施加了多少次相同行为类型的交互行为并不关注,因此,为了方便后续的统计,可在此处先行聚类,获得更为净化的数据,以提升后续统计阶段的运算效率。

其他常规的数据清洗手段可由本领域技术人员灵活施加,只要不影响本申请技术方案的实现即可。

本实施例通过进一步对数据进行清洗,有助于后续提升数据挖掘效率,更为高效地获得相关关联信息。

请参阅图3,深化的实施例中,优选余弦相似度算法计算所述的相似度数据,因此,所述步骤S1300、计算两两商品对象之间的相似度数据,包括如下步骤:

步骤S1310、基于各个行为类型,确定两两商品对象之间的关于该行为类型的相似度:

如前所述,两两商品之间,针对每个行为类型分别计算其相似度。本实施例中,进行相似度公式的计算时,采用余弦相似度算法,其计算过程在逻辑上可以体现为应用如下的公式:

其中f表示行为类型,取值范围为分别对应:点击行为类型、加购行为类型、下单行为类型、支付行为类型。ωf表示行为类型的权重。i和j分别代表商品对象i和j。

依据该公式可以看出,对于每个行为类型情况下,两个商品对象的用户总量Nf,i和Nf,j,被求交集,因此,Nf,i∩Nf,j即为该两个商品对象之间的共有用户总量。由于两两商品对象之间各个行为类型相对应的共有用户总量已经在在先的步骤中计算,例如前述的用于存储共有用户总量的矩阵,因此,可直接从事先计得的数据中获取即可。

由该公式可以看出,针对两两商品对象,需要对应各个行为类型分别计算相似度。

步骤S1320、应用预设的权重匹配方案,将两两商品对象的多个共有行为类型的相似度进行加权求和,获得两两商品对象之间的相似度数据:

考虑到各个具体行为类型之间的信息价值存在差异,例如,支付行为类型相对于点击行为类型具有更高的表示用户成交某商品对象的价值,因此,根据上述的公式,在计算相似度数据的过程中,对各个行为类型的相似度匹配权重ωf进行加权,将相应的加权和值作为两两商品对象之间的最终的相似度数据simi,j

不同行为类型之间的权重分配,构成一个权重匹配方案,本申请中,所述权重分配方案可以预先设定,在需要计算相似度数据时调用即可。该权重匹配方案也可以根据召回数据或者引用其他商品对象的排行榜信息进行自动调节,对此,本领域技术人员可灵活实施。考虑到各个行为类型之间的信息价值之间的关系,本实施例推荐所述权重匹配方案被配置为按以下排序自小至大匹配权重:点击行为数据、加购行为数据、下单行为数据、支付行为数据。可以理解,这一权重匹配方案体现了各个行为类型相对应的信息价值,使得相似度数据更能体现两两商品对象之间可能被用户关联购买的关联程度。

步骤S1330、构造用于存储所述相似度数据的相似度矩阵,其中每个元素用于存储其行坐标所指向的商品对象与其列坐标所指向的商品对象之间的相似度数据:

如前所述,为便于引用所述的相似度数据,建构一个二维矩阵[i:[j:simi,j,k:simi,k]…],该矩阵的行坐标与列坐标均按序指代商品数据库中的各个商品对象,由此,构成一个方阵,其中每个元素即用于存储其行坐标和列坐标分别指向的两个商品对象之间的相似度数据,后续通过引用这个二维矩阵的元素,便可获得相应的两个商品对象关的相似度数据。可以理解,其中每一个行向量,即存储一个商品对象与商品数据库中所有商品对象之间的相似度数据,当要确定某一商品对象的相似商品对象时,从其行向量中进行相似度匹配即可。

步骤S1340、对相似度矩阵中的相似度数据进行归一化:

由于在进行所述的相似度数据的计算时,各个元素的相似度数据一般不是基于相同统计尺度计得的,因此其彼此之间的相对关系尚未得到统一,故此,可应用如下的公式对的存储相似度数据的所述二维矩阵进行归一化:

其中,simi,j为商品对象i和商品对象j的相似度数据,n指示沿列坐标变动的不同元素,∑simi,n表示对商品对象i的行向量中的各个元素的相似度数据进行加和,scale_simi,j即为商品对象i和商品对象j被归一化后的相似度数据。至此,整个二维矩阵中,每个行向量的相似度数据便被统一到同一统计尺度,可被直接引用。

请参阅图4,深化的实施例中,所述步骤S1400、响应商品匹配指令,根据所述相似度数据为该指令指定的目标商品对象查询确定其相应的若干个相似商品对象,包括如下步骤:

步骤S1410、查找出与所述目标商品对象映射到所有商品对象的相似度数据:

当需要确定与一个目标商品对象相似的商品对象时,首先将与其存在相似度数据的所有商品对象均确定出来,具体到前述各实施例所称的二维矩阵中,将该目标商品对象相对应的行向量提取出来即可。如前所述,该行向量存储了所述目标商品对象映射到商品数据库中的所有商品对象的相似度数据。

步骤S1420、根据所述相似度数据进行倒排序:

为了方便提取出部分相似商品对象,此处可根据相似度数据对该行向量所映射的所有相似商品对象进行倒排序,使各个相似商品对象根据其与该目标商品对象的相似度的大小,自大至小排列。

步骤S1430、从排序结果中选取设定数量的若干个相似度数据最大的相似商品对象:

所筛选出的相似商品对象的数量一般会被预先规定,以避免产出过多的相似商品对象,因此,可采用Top_K算法,预先设定K的数值,从该行向量中选取出排序靠前的相应K个相似商品对象,构成一张相似商品对象列表。

步骤S1440、将所述相似商品对象推送给触发所述商品匹配指令的用户:

当所述商品匹配指令是由某个消费用户触发时,例如该用户进入一个“猜您喜欢”的页面,然后服务器将其解析为根据该用户刚刚访问的某个目标商品对象获取相似商品对象而触发所述的商品匹配指令,这种情况下,服务器获取到该目标商品对象的相似商品对象之后,便可将这些相似商品对象构成的相似商品对象列表推送给该用户,以作为对所述商品匹配指令的响应。

本实施例中通过提供为用户搜索相似商品的业务逻辑,使本申请所计算的相似度数据更加实用化,而服务于用户的相似商品对象匹配,不难理解,由于在本申请中,已经预先挖掘出了各个商品对象之间的关于购买业务流程相应的关联信息,因此,用户在接收到所述的相似商品对象之后,能够更高概率地点击所述的相似商品对象,甚至触发进一步的购买行为。

请参阅图5,适应本申请的目的之一而提供的一种商品协同推荐装置,是对本申请的商品协同推荐方法的功能化体现,该装置包括:数据获取模块1100、总量统计模块1200、相似度计算模块1300,以及响应推荐模块1400,其中,所述数据获取模块1100,用于获取商品数据库中的商品对象相对应的多个行为类型的交互行为数据,其中至少一个行为类型与其他行为类型有业务逻辑上的先后关系;所述总量统计模块1200,用于根据实施相同行为类型而产生同类交互行为数据的相同用户数量,统计两两商品对象之间各个行为类型相对应的共有用户总量;所述相似度计算模块1300,用于计算两两商品对象之间的相似度数据,所述相似度数据为根据相应的两个商品对象的各个行为类型的共有用户总量计算确定的相似度的和值;所述响应推荐模块1400,用于响应商品匹配指令,根据所述相似度数据为该指令指定的目标商品对象查询确定其相应的若干个相似商品对象。

深化的实施例中,所述数据获取模块1100包括:历史数据获取子模块,用于获取商品数据库中的商品对象相对应的用户历史行为数据;数据清洗子模块,用于对所述用户历史行为数据进行数据清洗,确定每个商品对象相对应的多个行为类型的交互行为数据,相应包括作用于商品对象的点击行为数据与如下至少任意一项:商品对象被添加到购物车的加购行为数据、商品对象的下单行为数据、商品对象的订单的支付行为数据。

深化的实施例中,所述相似度计算模块1300包括:行为计算子模块,用于基于各个行为类型,确定两两商品对象之间的关于该行为类型的相似度;加权计算子模块,用于应用预设的权重匹配方案,将两两商品对象的多个共有行为类型的相似度进行加权求和,获得两两商品对象之间的相似度数据;矩阵构造子模块,用于构造用于存储所述相似度数据的相似度矩阵,其中每个元素用于存储其行坐标所指向的商品对象与其列坐标所指向的商品对象之间的相似度数据;矩阵归一化子模块,用于对相似度矩阵中的相似度数据进行归一化。

较佳的实施例中,所述行为计算子模块被配置为采用如下任意一种算法进行相似度计算:余弦相似度算法、欧式距离算法、皮尔逊相关系数算法、杰卡德算法、对数似然算法、曼哈顿距离算法。

较佳的实施例中,所述加权计算子模块中,所述权重匹配方案被配置为按以下排序自小至大匹配权重:点击行为数据、加购行为数据、下单行为数据、支付行为数据。

深化的实施例中,所述商品推荐模块包括:相似查询子模块,用于查找出与所述目标商品对象映射到所有商品对象的相似度数据;结果排序子模块,用于根据所述相似度数据进行倒排序;相似选取子模块,用于从排序结果中选取设定数量的若干个相似度数据最大的相似商品对象;相似推荐子模块,用于将所述相似商品对象推送给触发所述商品匹配指令的用户。

为解决上述技术问题,本申请实施例还提供计算机设备。如图6所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种商品协同推荐方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的商品协同推荐方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

本实施方式中处理器用于执行图5中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的商品协同推荐装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。

本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的商品协同推荐方法的步骤。

本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本申请任一实施例所述方法的步骤。

本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。

综上所述,本申请借助数据挖掘手段,对用户行为数据进行深度数据挖掘,实现对用户行为数据中的行为类型信息的利用,能够提升推荐给用户的相似商品对象的匹配度,更加匹配用户真实需求,使相似商品对象获得更高的点击率。

本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。

以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

19页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于单位用户码的管控方法及其管控系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!