新闻中心

EEPW首页 > 智能计算 > 设计应用 > 基于类别图增强算法的融合异构数据会话推荐分析

基于类别图增强算法的融合异构数据会话推荐分析

作者:李彩霞(河南工业贸易职业学院信息工程学院,郑州 451191)时间:2023-08-24来源:电子产品世界收藏
编者按:为了提高融合异构数据会话推荐效率,设计了一种通过类别图来实现增强效果的推荐算法。在融合层内融合物品与类别表征结果,确保物品表征中包含类别数据;根据注意力机制建立全局表征,再通过局部表征建立最终表示;通过预测层计算各候选对象推荐参数。研究结果表明:设计得到的CaSe4SR模型对各类数据集都表现出了最优推荐性能,CaSe4SR-W模型表现出了比Concat与CaSe4SR两种模型更差的性能,推断类别信息需结合物品信息共同建模,需根据物品参数才可以发挥信息补充功能。

基金项目:河南省重点研发与推广专项,项目编号202102210177

本文引用地址:http://www.eepw.com.cn/article/202308/449928.htm

0 引言

从会话层面分析,在未掌握全面的用户身份信息并且不知道会话序列包含的物品个数条件下,如果只根据物品参数来建立ID 标签序列模型时,并无法准确捕获用户实际意图,某些情况下还会出现关于用户意图的错误理解结果。首先,当会话序列较短的情况下,无法通过有限交互行为准确反馈出用户实际意图。考虑到大部分时候都无法得到用户的身份信息,而且只有短时间中的用户交互记录才是有效的,这对大量处理方法造成了制约。

对人们日常使用的各大购物平台进行分析可知,拼多多、淘宝、京东等电子商务服务平台为提升搜索效率,通常都会针对各物品设置相应的类别标签。通过上述方式促使用户更加快速准确找寻他们所需的商品,同时平台还可通过推荐系统中显示的用户访问信息推送同一类产品。综合考虑物品与类别因素可以判断出用户的实际意图。根据文献[1]报道可以发现,以图神经网络构建会话序列模型的时候,如果只针对单一物品结构进行建模,即只根据物品ID 序号构建模型时,将会造成部分概念层数据丢失的结果。当会话序列处于匿名状态下时,无法包含所有用户行为,如果只根据单一层面构建模型时将会在用户偏好方面产生较大偏差。本文对于上述分析结果,设计了一种通过类别图来实现增强效果的推荐算法。可以利用此算法为物品建立类别序列,再通过图神经网络为上述序列构建仿真模型,从而实现2 个层面的物品属性评价,对2 个层面的测试结果进行融合后确定会话用户的偏好结果。

1

在网络中输入各物品ID与类别序列再对其表征后,获得每种序列下的各节点表征结果。由于类别属于物品的特定属性,可将其作为物品ID 标签序列的补充数据。CaSe4SR-W 方法是利用加权融合的过程来判断全局偏好:物品与类别序列都是按照相互独立的方式完成输入与表征过程,因此进行融合的时候先独立处理2 个序列,之后测试融合所得的结果。上述融合模式是计算物品图与类别图的注意力加权数据,之后再对其实施融合,结果见图1。

1692873145594273.png

图1 加权融合全局偏好方法

以下给出了具体处理步骤:

首先通过注意力机制加权计算物品表征向量,从而实现物品的效果,具体见式(1)(2):

1692873212803140.png   (1)

1692873267351188.png   (2)

之后利用注意力机制加权计算类别表征向量,由此完成类别,构建得到式(3)~(4):

1692873337935320.png   (3)

1692873395491801.png   (4)

最后一步是对以上获得的物品与类别层面进行,融合物品与类别层面的信息后,可以更加全面描述物品特征,这使得各类ID 标签的物品因为类别标签一致,也表现出了一定程度的相似性。通过会话表示层拼接局部与全局表征,再利用线性转换方法确定最终会话表征。

2 实验

2.1 Cosmetics数据集及预处理

从Kaggle 平台上采集测试参数,选择中等化妆品在线商店在线用户行为进行分析。为确保数据处理过程更好地满足一般性,将长度不在2~50 范围的会话内容去除,同时不考虑出现次数在5 次以内的物品。表1 是统计得到的数据集参数。

表1 数据集统计

1692873595264167.png

2.2 对比方法介绍及实验设置

为了对算法进行可靠性验证,以SR-GNN[36] 模型作为基准对比条件。

将模型设定为以下所示的控制参数:采用TensorFlow框架对模型开展训练。将数据集中的表征向量维度设置在100。同时将模型各参数矩阵均值都设置为0,标准差等于1,按照高斯分布形态实施初始化。通过minibatchAdam优化器调整上述参数,设定最初学习率等于0.001。控制训练批次为100,L2 惩罚保持105 的恒定值。

2.3 实验结果及分析

为验证以类别图增强方法构建的模型满足有效性,本次利用2 个数据集分别测试了CaSe4SR、SR-GNN模型与CaSe4SR 变体模型,得到表2参数。

表2 不同方法的结果对比

1692873682477925.png

根据表格参数可知,设计得到的CaSe4SR 模型对各类数据集都表现出了最优推荐性能。同时可以发现,其他3 类包含类别信息数据的模型都获得了比SRGNN模型更优的性能,考虑到各模型具有自身独特的建模过程,因此实际提升幅度也存在较大区别。Concat与CaSe4SR 虽然是以不同形式进行建模,但都在建模过程中融合了物品与类别信息,可以将物品类别与表征形成一一对应关系。CaSe4SR-W 则依次通过类别特征和物品实施建模,最后再对其实施融合。根据测试结果可知,CaSe4SR-W 模型表现出了比Concat 与CaSe4SR两种模型更差的性能,由此可以推断类别信息需结合物品信息共同建模,需根据物品参数才可以发挥信息补充功能。Concat 相对Case4SR 模型推荐性更弱,因此采用有向图表示类别序列,同时引入门控图神经网络建立模型的过程满足可靠性要求。

3 结束语

本文开展基于的融合分析,得到如下有益结果:

1)设计了一种包含5 层结构的CaSe4SR 仿真模型,在融合层内融合物品与类别表征结果,确保物品表征中包含类别数据;根据注意力机制建立全局表征,再通过局部表征建立最终表示;通过预测层计算各候选对象推荐参数。

2)设计得到的CaSe4SR 模型对各类数据集都表现出了最优推荐性能,CaSe4SR-W 模型表现出了比Concat 与CaSe4SR 两种模型更差的性能,推断类别信息需结合物品信息共同建模,需根据物品参数才可以发挥信息补充功能。

参考文献:

[1] 贾丹,孙静宇.基于用户会话的TF-Ranking推荐方法[J]. 应用科学学报,2021,39(3):495-507.

[2] 任俊伟,曾诚,肖丝雨,等.基于会话的多粒度图神经网络推荐模型[J].计算机应用,2021,41(11): 3164-3170.

[3] 方军,管业鹏.基于双编码器的会话型推荐模型[J].西安交通大学学报,2021,55(8):166-174.

[4] WU S, TANG Y, ZHU Y, et al. Session-based recommendation with graph neural networks[C]. Proceedings of the AAAI Conference on Artificial Intelligence, Hawaii, United States,2019,33(1):346-353.

[5] 闫昭,项欣光.基于整体序列建模的模型[J]. 南京理工大学学报,2021,45(1):27-36.

[6] 张海通,黄增峰.基于影响力扩散的模型[J].计算机应用研究,2021,38(7):1956-1962.

[7] 南宁,杨程屹,武志昊.基于多图神经网络的会话感知推荐模型[J].计算机应用,2021,41(2):330-336.

[8] WANG M, REN P, MEI L,et al. A collaborative sessionbased recommendation approach with parallel memory modules[C]. Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval, Paris, France, 2019: 345-354.

[9] 曾义夫,牟其林,周乐,等.基于图表示学习的会话感知推荐模型[J].计算机研究与发展,2020,57(3):590-603.

[10] 李晶皎,孙丽梅,王骄.提高会话推荐多样性的SRL推荐系统模型[J].东北大学学报(自然科学版),2013,34(5): 650-653+662.

[11] 刘浩翰,吕鑫,李建伏.考虑用户意图和时间间隔的会话型深度学习推荐系统[J].计算机应用与软件,2021,38(3): 190-195+223.

[12] 王鸿伟,过敏意.刻画长短期用户兴趣的基于会话的推荐系统[J].中国科学:信息科学,2020,50(12):1867-1881.

(本文来源于《电子产品世界》杂志2023年8月期)



评论


技术专区

关闭