基于社交网络能量扩散的协同过滤推荐算法

引用本文

任永功, 王瑞霞, 张志鹏. 基于社交网络能量扩散的协同过滤推荐算法. 模式识别与人工智能, 2021,34(6): 561-571
REN Yonggong, WANG Ruixia, ZHANG Zhipeng. Collaborative Filtering Recommendation Algorithm Based on Energy Diffusion in Social Network. PATTERN RECOGNITION AND ARTIFICIAL INTELLIGENCE, 2021,34(6): 561-571. 复制到剪切板

Doi: 10.16451/j.cnki.issn1003-6059.202106008
Permissions

《模式识别与人工智能》编辑部

基于社交网络能量扩散的协同过滤推荐算法

任永功¹, 王瑞霞¹, 张志鹏¹

1.辽宁师范大学计算机与信息技术学院大连 116081

通讯作者:

张志鹏,博士,讲师,主要研究方向为数据挖掘、推荐系统.E-mail:zhipengzhang@lnnu.edu.cn.

作者简介:

任永功,博士,教授,主要研究方向为人工智能、数据挖掘.E-mail:jsj_paper@163.com.

王瑞霞,硕士研究生,主要研究方向为人工智能、数据挖掘.E-mail:1420942208@qq.com.

收稿日期: 2021-10-16 接受日期: 2021-05-13

资助项目: 国家自然科学基金项目(No.61976109)、辽宁省自然科学基金博士启动项目(No.2020-BS-184)、大连市科技创新基金项目(No.2018J12GX047)、大连市高层次人才创新支持计划项目(No.2020RQ49)、大连市重点实验室专项基金项目资助

摘要

针对数据稀疏导致推荐系统精确度较低的问题,结合社交网络中丰富的社会化信息及能量扩散在数据稀疏问题上的优良表现,文中提出基于社交网络能量扩散的协同过滤推荐算法.首先利用用户-物品评分矩阵和信任关系具有的传递性计算用户之间信任强度值.再利用社交网络结合用户-物品二分网络,得到物品资源值.最后利用协同过滤方法进行预测评分.在真实数据集上的实验表明,文中算法缓解数据稀疏性,可解决推荐精确度较低的问题.

关键词: 推荐系统; 协同过滤; 能量扩散; 社交网络

中图分类号:TP391

Collaborative Filtering Recommendation Algorithm Based on Energy Diffusion in Social Network

REN Yonggong¹, WANG Ruixia¹, ZHANG Zhipeng¹

1. School of Computer and Information Technology, Liaoning Nor-mal University, Dalian 116081

Corresponding author:
ZHANG Zhipeng,Ph.D., lecturer. His research interests include data mining and recommender system.

About Author:
REN Yonggong, Ph.D., professor. His research interests include artificial intelligence and data mining.
WANG Ruixia, master student. Her research interests include artificial intelligence and data mining.

Fund:National Natural Science Foundation of China(No. 61976109), Doctoral Start-up Foundation of Natural Science Foundation of Liaoning Province(No.2020-BS-184), Dalian Science and Technology Innovation Fund(No.2018J12GX047), Dalian High Level Talents Innovation Support Project(No.2020RQ49), Dalian Key Laboratory Special Fund

Abstract

To improve the low accuracy caused by sparse data in the recommender system, a collaborative filtering recommendation algorithm based on energy diffusion in social networks is proposed. The abundant social information in social network and the excellent performance of energy diffusion in data sparsity are combined. Firstly, the transitivity of user-item scoring matrix and trust relationship is exploited to calculate the trust intensity value between users. Then, the resource value of items is obtained by combining the social network with the user-item binary network. Finally, the collaborative filtering method is utilized to predict the score. Experiments on real datasets show that the proposed method alleviates data sparsity and solves the problem of low recommendation accuracy.

Key words: Key Words Recommender System; Collaborative Filtering; Energy Diffusion; Social Network

文章图片

本文责任编委梁吉业

Recommended by Associate Editor LIANG Jiye

随着人工智能与大数据的飞速发展, 推荐系统(Recommender System, RS)^[1]受到学者们的广泛关注.RS分析用户的行为, 找到用户的个性化需求, 从而将商品推荐给相应用户, 帮助用户找到自己想要但难以发现的商品.现阶段RS广泛用于电子商务和社交网络.

目前在RS中常见的推荐方法为协同过滤(Collaborative Filtering, CF)^[2]、基于内容过滤推荐算法和混合过滤推荐算法.CF是应用最普遍的算法之一, 分为基于记忆的协同过滤和基于模型的协同过滤.CF根据目标用户的邻近用户的反馈、评价等信息预测目标用户对未评分物品的评分, 给目标用户推荐Top-n物品.随着社交网络的快速发展, 基于社交网络的推荐已变成一种重要且有成效的方式.

但是, 在CF中存在精确度较低的问题, 其原因在于缺少用户对物品的评分历史数据, 即数据稀疏性, 在某一极端情况下可看作是冷启动的问题.如果在数据量较大且又稀疏的情况下, 相似性计算的耗费会很大, 也难以给用户精准推荐, 影响推荐质量^[3].

基于内容的过滤算法是抽取用户和物品的特征信息, 不需要用户对物品评级, 可有效缓解数据稀疏性的问题.Son等^[4]采用基于内容的协同过滤方法, 构建多属性的网络, 反映属性之间的关联, 可缓解推荐系统的稀疏性问题, 但挖掘属性有限, 难以构造属性更丰富的网络.

混合过滤算法中常见方法是混合基于内容过滤算法和CF, 在一定程度上可提高推荐质量^[5].Tian等^[6]结合高校图书和读者的特点, 进行读者的分类和构建评分向量的空间模型, 利用聚类方法结合两者, 在一定程度上缓解数据稀疏问题, 但未利用读者的社会信息, 在分类问题上不具有全面性.

基于社交网络推荐算法和基于图的推荐算法是目前较通用的推荐方式, 通过引入社交网络信息、朋友信息, 有效提高推荐质量, 实现个性化推荐^[7].Xu^[8]将矩阵分解技术(Matrix Factorization Techni-que)运用到社交网络中, 并考虑各种复杂的因素及社会关系, 提升推荐性能, 但未深入挖掘用户在社交网络中的额外社会化信息, 导致推荐结果不一定准确.Lai等^[9]在社交网络的基础上提出基于用户信任关系和物品的流行度推荐算法.根据用户评论推断用户之间的潜在交互, 在一定程度上缓解信息过载的问题, 但在分析用户之间的信任关系时使用0或1描述信任或不信任, 没有具体的数值, 未显著提高推荐精确度.Kart等^[10]提出基于监督机器学习的加权二部图链接预测模型, 将用户的项目评论映射为二部图结构, 并优化结构, 提高预测质量, 但未能有效缓解数据稀疏问题.Zhao等^[11]提出改进二部图的方法, 提取用户偏好的类型权重特征, 结合用户的相似度构建推荐模型.该方法的性能在一定程度上较优, 但是没有有效缓解数据稀疏的问题, 且存在推荐精确度较低的问题.Jiang等^[12]融合信任数据与用户相似度并加入改进的推荐模型, 未缓解数据稀疏问题, 未显著提高推荐精确度.Zhang等^[13]利用评分信息构建隐式社交网络, 通过图表示学习方法预测评分, 但没有利用显式社会化信息, 未能有效提高推荐精确度.Guo等^[14]提出社会化推荐算法, 将评分信息和社交网络信息分解为低维特征矩阵进行预测评分, 但降维时会导致信息缺失, 未显著提高推荐精度.

针对上述方法存在的问题, 本文提出基于社交网络能量扩散的协同过滤推荐算法(Social Network Energy Diffusion Based CF, SNED).首先运用预测误差方法建立用户信任值计算模型, 计算两位用户之间的信任强度值, 并根据信任传递性挖掘用户之间的隐式信息, 丰富用户之间的社交信息.然后通过参数结合社交网络与用户-物品二分网络, 有效提高推荐系统中推荐物品的精确度.最后利用资源扩散理论, 通过社交网络能量扩散计算物品与物品之间的资源值, 即相似度值.进而通过CF对用户未评分的物品进行预测评分, 向用户提供高精准和高质量的推荐.实验表明, 本文算法可在一定程度上有效缓解数据稀疏性问题, 提高物品推荐的精确度.

1 基于社交网络能量扩散的协同过滤推荐算法

1.1 计算用户之间的信任强度

根据人类社会学理论, 用户在社交中经常会对和本身具有相同“ 口味” (对同一物品评级)的人产生亲密性, 可以通过这样的亲密性计算信任强度并为用户推荐物品.本文根据用户之间的亲密性建立用户之间直接信任强度计算的模型, 首先将用户对物品的评级值进行标准化, 再计算用户对物品的预测误差评分, 最后根据信任强度计算模型计算两位用户之间的信任强度值.

首先进行数据预处理.为了让信任值结果更精准, 将用户之间的评级值采用大小标准化方法^[15], 将评级值标准化到[0, 1]内.根据标准化方法, 将数据集中一个原始的评级值R转化为新的评级值

r= $\frac{R - \min}{\max - \min}$ ,

其中, max、min分别表示用户评分集中最大评级值、最小评级值.根据新的评级值计算直接信任强度.

定义1 为了衡量用户之间直接信任强度, 引入用户U_x对物品I_i的预测误差评分值Prediction error^[16].令U为推荐系统中所有用户集合, 用户U_x∈ U, U_y∈ U, I为推荐系统中所有物品集合, 物品I_i∈ I, 则

P $r_{U_{x}, I_{i}}$ = ${\bar{r}}_{U_{x}}$ +( $r_{U_{y}, I_{i}}$ - ${\bar{r}}_{U_{y}}$ ),

其中, ${\bar{r}}_{U_{x}}$ 表示用户U_x标准化评级的均值, ${\bar{r}}_{U_{y}}$ 表示U_y标准化评级的均值, $r_{U_{y}, I_{i}}$ 表示用户U_y对物品I_i标准化后的评级值.

定义2 用户U_x对用户U_y的直接信任强度值:

其中, $I_{U_{x}}$ ={I_i∈ I| $r_{U_{x}, I_{i}}$ ≠ · }表示用户U_x评级物品的集合, $I_{U_{y}}$ ={I_i∈ I| $r_{U_{y}, I_{i}}$ ≠ · }表示用户U_y评级的物品集合, $r_{U_{x}, I_{i}}$ 表示标准化后的用户U_x对物品I_i的评级值, | $I_{U_{x}}$ |表示用户U_x评分的物品数量, | $I_{U_{y}}$ |表示用户U_y评分的物品数量, $I_{U_{x}}$ ∩ $I_{U_{y}}$ 表示用户U_x、U_y共同评级的物品集, | $I_{U_{x}}$ ∩ $I_{U_{y}}$ |表示用户U_x、U_y共同评级物品的数量.计算得到的直接信任强度值的范围在[0, 1]内.

由于信任关系具有传递性, 当用户之间没有直接信任值时, 可利用信任传递关系挖掘用户之间的间接信任关系, 建立新的关系.用户间接信任关系如图1所示.

	Figure Option View Download New Window
	图1 用户间接信任关系Fig.1 Indirect trust relationship of users

定义3 假设用户U_x∈ U(源用户), 用户U_x的信任用户U_y∈ U(中间用户), 同时用户U_y的信任用户U_z∈ U(目标用户), 通过信任传播方法可推断用户U_x在某种程度上可以信任用户U_z, 它们之间的间接信任强度值如下:

其中, U_y∈ trust(U_x, U_z)表示共同信任用户U_x、U_z的用户集合.

结合式(1)和式(2), 计算用户与用户之间的信任值, 并构成信任矩阵:

Intimacy=EXP+IMP, (3)

其中, EXP表示直接信任矩阵, IMP表示间接信任矩阵.本文利用余弦相似度计算用户之间的相似度:

similarl $y_{U_{x}, U_{y}}$ = $\frac{\sum_{I_{i} \in I_{U_{x} ⋂ U_{y}}} R_{U_{x}, I_{i}} R_{U_{y}, I_{i}}}{\sqrt[]{\sum_{I_{i} \in I_{U_{x} ⋂ U_{y}}} (R_{U_{x}, I_{i}})^{2}} \sqrt[]{\sum_{I_{i} \in I_{U_{x} ⋂ U_{y}}} (R_{U_{y}, I_{i}})^{2}}}$ , (4)

其中, $R_{U_{x}, I_{i}}$ 表示用户U_x对物品I_i的评分值, $R_{U_{y}, I_{i}}$ 表示用户U_y对物品I_i的评分值.

在用户之间的相似度值和信任强度值不为0的情况下, 通过加权思想结合信任强度模型与余弦相似度模型, 得到用户U_x、U_y的最终信任强度模型, 如图2所示.

	Figure Option View Download New Window
	图2 用户最终信任强度模型Fig.2 User final trust intensity model

图2中结合用户的信任矩阵和用户之间的相似矩阵, 得到用户的最终信任矩阵T,

$T_{U_{x}, U_{y}}$ = $\frac{2 similarl y_{U_{x}, U_{y}} \cdot Intimac y_{U_{x}, U_{y}}}{similarl y_{U_{x}, U_{y}} + Intimac y_{U_{x}, U_{y}}}$ , (5)

最终信任强度取值范围在[0, 1]内.

1.2 计算物品间的相似度

经典的基于物品协同过滤算法通过用户间的共同评分计算相似度, 本文算法结合社交网络和用户-物品二分网络^[17], 计算物品间的相似度.

构造与用户U_x的度相关的对角矩阵:

Λ _U=diag( $d_{1}^{u}$ , …, $d_{U_{x}}^{u}$ , …, $d_{m}^{u}$ ),

其中

$d_{U_{x}}^{u}$ = $\{\begin{array}{l} \frac{1}{k_{U_{x}}}, & k_{U_{x}} \neq 0 \\ 0, & k_{U_{x}} = 0 \end{array}$

$k_{U_{x}}$ 表示用户U_x选择的物品数.

与用户U_x信任关系的度相关的对角矩阵如下:

Λ _T=diag( $d_{1}^{t}$ , …, $d_{U_{x}}^{t}$ , …, $d_{m}^{t}$ ),

其中

$d_{U_{x}}^{t}$ = $\{\begin{array}{l} \frac{1}{T_{U_{x}}}, & T_{U_{x}} \neq 0 \\ 0, & T_{Ux} = 0 \end{array}$

$T_{U_{x}}$ 表示用户U_x信任朋友数.

与物品的度相关的对角矩阵如下:

Λ _I=diag( $d_{1}^{I}$ , …, $d_{I_{i}}^{I}$ , …, $d_{n}^{I}$ ),

其中

$d_{I_{i}}^{I}$ = $\{\begin{array}{l} \frac{1}{k_{I_{i}}}, & k_{I_{i}} \neq 0 \\ 0, & k_{I_{i}} = 0 \end{array}$

$k_{I_{i}}$ 表示选择物品I_i的用户数

为了提高本文算法的推荐准确度, 混合网络模型扩散步骤如图3所示.图中用户与物品之间的连线表示用户选择其物品, 用户与用户之间的连线表示用户信任该用户, 涂黑的物品表示目标物品.

	Figure Option View Download New Window
	图3 混合网络扩散步骤Fig.3 Diffusion process of hybrid network

混合网络扩散步骤具体如下.

1)首先将物品1(图3中涂黑为目标物品)的初始资源值设置为1, 其余物品的初始资源值为0, 得到物品的初始向量:

f₀=(f₁, …, $f_{I_{i}}$ , …, f_n)^T.

2)物品的资源被平均分配给用户, 用户得到资源向量:

h=A_UIΛ _I f₀.

其中, A_UI= $(a_{U_{x}, I_{i}})_{m \times n}$ , 表示用户与物品的二分网络矩阵.

3)用户将拥有的λ 资源通过用户- 物品二部图平均分配给选择过的物品, 物品得到资源向量:

f₁=λ ${A^{T}}_{UI}$ Λ _Uh=λ ${A^{T}}_{UI}$ Λ _UA_UIΛ _I f₀.

4)用户将拥有的1-λ 部分资源通过信任网络给自身的信任用户, 用户得到资源向量:

f₂=(1-λ )TΛ _Th=(1-λ )TΛ _TA_UIΛ _I f₀.

5)信任的用户将获得的资源通过用户- 物品二部图平均分配选择的物品, 物品得到资源向量:

f₃= ${A^{T}}_{UI}$ Λ _U f₂.

物品得到最终的资源向量:

算法的转移矩阵

P=λ ${A^{T}}_{UI}$ Λ _UA_UIΛ _I+(1-λ ) ${A^{T}}_{UI}$ Λ _UTΛ _TA_UIΛ _I,

其中

λ ∈ [0, 1], $T_{U_{y}}$ 表示被用户U_y信任的朋友数量, 从而得到二分网络中n× n维的物品关系矩阵, 即物品间的相似矩阵:

similarly' $_{I_{i}, I_{j}}$ = $P_{I_{i}, I_{j}}$ .(6)

通过参数进行调节:当参数为1时, 所有资源只在用户-物品的二部图中进行扩散; 当参数为0时, 所有资源只在用户-用户社交网络中扩散.

1.3 预测评分

计算用户U_x对未评分物品I_i的预测评分:

rating' $_{U_{x}, I_{i}}$ = $\frac{\sum_{similarly_item, N (I_{i})} (similarly'_{I_{i}, N (I_{i})} \cdot R_{U_{x}, N (I_{i})})}{\sum_{similarly_item, N (I_{i})} (| similarly'_{I_{i}, N (I_{i})} |)}$ , (7)

其中, I_i∈ $I_{U_{x}}^{c}$ 为任意一个没有被用户U_x评过分的物品, N(I_i)为物品I_i的相似物品的集合, $R_{U_{x}, N (I_{i})}$ 为用户U_x对相似物品集的评级值, |similarly' $_{I_{i}, N (I_{i})}$ |为物品I_i与相似物品集的相似值.

评分预测模型如图4所示.

	Figure Option View Download New Window
	图4 评分预测模型Fig.4 Scoring prediction model

1.4 算法步骤

算法基于社交网络能量扩散的协同过滤推荐

算法

输入用户-物品评分矩阵R,

评分标准化矩阵NR,

用户-物品二部图矩阵A_UI, λ

输出为目标用户U_x推荐n个物品

根据用户之间的亲密性计算直接信任强度值;

for x= 1 to card(m) do

for y=1 to card(m) do

根据式(1)计算用户之间直接信任强度值

EX $P_{U_{x}, U_{y}}$

end for

利用信任传递性计算用户之间的间接信任强度值;

for x=1 to card(m) do

for z=1 to card(m) do

根据式(2)计算用户之间的间接信任强度值

IM $P_{U_{x}, U_{z}}$

end for

根据式(3)计算信任矩阵Intimacy;

for x=1 to card(m) do

for y=1 to card(m) do

根据式(4)计算用户之间的相似度值

end for

根据式(5)得到用户之间的最终信任矩阵T;

构造关于用户的度对角矩阵Λ _U、物品的度对角矩阵Λ _I、用户间信任关系的度对角矩阵Λ _T;

for i=1 to card(n) do

for j=1 to card(n) do

根据式(6)计算物品间相似矩阵

end for

for ∀ I_i∈ $I_{U_{x}}^{c}$ do

得到I_i的相似物品集合N(I_i)

for ∀ I_j∈ N(I_i) do

根据式(7)计算预测评分

end for

向用户U_x推荐前n个具有最高评分的物品

1.5 复杂度分析

假设推荐系统中有n个物品, p为用户-物品二分网络中总边数, q为社交网络中的总边数, 协同过滤中相似度算法的时间复杂度为O(n²).本文算法的时间复杂度主要取决于用户-物品二分网络及社交网络.用户-物品二分网络的时间复杂度为O(pn), 社交网络中的时间复杂度为O(qn), 计算复杂网络相似度的时间复杂度为O(pn)+O(qn).在数据稀疏的情况下p、q远小于系统内物品总数量n, 在现实中p、q也不大, 因此本文算法的时间复杂度为O(n)+O(n), 在CF上未产生过高消耗.

2 算法实例

本节给出具体实例说明算法步骤.首先给出用户-物品评分矩阵和用户-物品标准化评分矩阵, 如表1和表2所示.

表1 用户-物品评分矩阵 Table 1 User-item scoring matrix

表2 用户-物品标准化评分矩阵 Table 2 User-item standardized scoring matrix

根据式(6)和式(7), 设参数λ =1/2, 计算物品之间的相似度和用户对物品的预测评分, 如表3和表4所示.

表3 物品之间的相似度 Table 3 Similarity between items

表4 用户对物品的预测评分 Table 4 User rating scale for item prediction

例如对用户1进行物品推荐, 由表4可知, 用户1对物品5的预测评分为1.3, 对物品2和物品4的评分值为0.9, 因此将物品5推荐给用户1.

3 实验及结果分析

本文选取推荐系统中常见的基于社交网络的FilmTrust、CiaoDVD数据集评估算法性能.具体数据集信息如表5所示.

表5 实验数据集 Table 5 Experimental datasets

数据集上随机选取80%的数据作为训练集, 20%的数据作为测试集, 采用五折交叉验证方法.根据文献[18], 邻近物品集取值为10、20、30、40、50.推荐物品长度n=2, 4, 6, 8, 10, 12.当评分阈值θ ≥ 2时, 该物品为用户喜欢的物品.

采用精确率(Precision)和召回率(Recall)衡量算法分类精度:

其中: $Z_{U_{x}}$ 表示给用户推荐n个物品的集合, n=2, 4, 6, 8, 10, 12; U表示推荐系统中所有用户的集合; #U表示所有用户总数; θ 表示阈值, 本文中θ =2; I_i∈ $Z_{U_{x}}^{c}$ , 表示推荐物品集之外的物品的集合.precision值和Recall值越大, 说明算法精确度越高.

F₁为precision与recall的结合:

F₁= $\frac{2 \times precision \times recall}{precision + recall}$ .

采用平均精度(P)衡量整个推荐系统的平均精确度^[19]:

$P_{U_{x} \in U}$ (L)= $\frac{d_{U_{x} \in U} (L)}{L}$ ,

其中, $d_{U_{x} \in U}$ (L)为在推荐列表中前L个位置上的物品, 同时也是在测试集中用户评分的物品.平均精确度值越大, 说明算法精确度越高.

采用平均绝对误差(Mean Absolute Error, MAE)和均方根误差(Root Mean Square Error, RMSE)衡量算法的预测精度:

其中: $R_{U_{x}, I_{i}}$ 表示用户U_x对物品I_i有评分值;

$O_{U_{x}}$ ={I_i∈ I| $p_{U_{x}, I_{i}}$ ≠ · ∧ $R_{U_{x}, I_{i}}$ ≠ · },

· 表示缺乏评分值, $R_{U_{x}, I_{i}}$ =· 表示用户U_x对物品I_i没有评分值; $p_{U_{x}, I_{i}}$ 表示用户U_x对物品I_i的预测评分值.MAE值和RMSE值越小, 说明算法的预测精确度越高.

为了验证本文算法性能, 选取如下对比算法, 其中前两种算法为本文基础算法.

1)基于物品的协同过滤算法(Item-Based Colla-borative Filtering, IBCF)^[20].

2)基于二分网络能量资源扩散推荐算法(Proba-

bilistic Spreading, Probs)^[17].

3)基于信任协同过滤推荐算法(Trust-Based Collaborative Filtering, BIPS)^[12].运用评级偏差并结合用户之间的相似度, 提高推荐系统的精确度.

4)社交网络中利用图表示方法学习网络嵌入推荐算法(Collaborative User Network Embedding, CUNE)^[13].利用评分信息构建隐式社交网络, 通过图表示学习方法进行网络嵌入, 得到嵌入矩阵, 进行预测评分.

5)基于信任的奇异值分解算法(Trust Based Sin-gular Value Decomposition, TrustSVD)^[14].将评分信息和社交网络结合, 反馈到矩阵分解模型中, 预测目标用户对未评分物品的评分, 为用户推荐.

在本文算法(SNED)中引入调节参数λ , 当推荐长度为2, 邻近物品为10, λ 不同时指标值的变化趋势如图5所示.由图可看出, 随着λ 的增大, 指标值都随之增大, 当λ =0.2时指标值达到峰值, 之后小幅下降, 最后趋向平稳.

	Figure Option View Download New Window
	图5 λ 对指标值的影响Fig.5 Effect of λ on index value

在2个数据集上进行对比实验, 各算法的邻近物品集为10~50, 推荐物品数为2~12, λ =0.2.各算法在2个数据集上的Precision值对比如表6所示, 表中黑体数字表示最优结果.由表可见, 在大部分情况下, 本文算法的Precision值最高.

表6 各算法在2个数据集上的Precision值对比 Table 6 Comparison of precision values of different algorithms on 2 datasets

n	算法	FilmTrust1(邻近物品集)					CiaoDVD(邻近物品集)
n	算法	10	20	30	40	50	10	20	30	40	50
2	IBCF	0.28560	0.28281	0.27645	0.22195	0.20445	0.01245	0.01107	0.00998	0.00919	0.00857
	BIPS	0.46937	0.47613	0.44908	0.31901	0.41050	0.01146	0.01398	0.01295	0.01021	0.00993
	Probs	0.46101	0.46101	0.46101	0.46101	0.46101	0.01527	0.01527	0.01527	0.01527	0.01527
	CUNE	0.52443	0.50390	0.50361	0.50318	0.50249	0.01934	0.01846	0.01846	0.01841	0.01795
	TrustSVD	0.51546	0.51546	0.51525	0.51534	0.51531	0.02328	0.02290	0.02042	0.02042	0.02042
	SNED	0.64200	0.51789	0.63762	0.62092	0.58790	0.02391	0.01495	0.02127	0.02096	0.02044
4	IBCF	0.18134	0.16229	0.12688	0.12251	0.09506	0.00951	0.00648	0.00593	0.00710	0.00722
	BIPS	0.23468	0.23806	0.23329	0.22454	0.19590	0.00872	0.00947	0.00847	0.00923	0.00822
	Probs	0.42283	0.42283	0.42283	0.42283	0.42283	0.01076	0.01076	0.01076	0.01076	0.01076
	CUNE	0.48254	0.48222	0.48116	0.48095	0.48105	0.01503	0.01491	0.01493	0.01389	0.01244
	TrustSVD	0.48391	0.48253	0.48249	0.48207	0.48207	0.01587	0.01566	0.01528	0.01397	0.01285
	SNED	0.61793	0.48269	0.56622	0.61793	0.56105	0.01741	0.01728	0.01644	0.01421	0.01344
6	IBCF	0.16083	0.16030	0.09652	0.06947	0.06036	0.00764	0.00565	0.00558	0.00545	0.00531
	BIPS	0.15552	0.17806	0.15871	0.15645	0.14969	0.00557	0.00565	0.00534	0.00508	0.00432
	Probs	0.38451	0.38451	0.38451	0.38451	0.38451	0.00913	0.00913	0.00913	0.00913	0.00913
	CUNE	0.42727	0.42727	0.42718	0.42701	0.42701	0.01231	0.01178	0.01178	0.01141	0.01195
	TrustSVD	0.43006	0.42989	0.42989	0.42997	0.42972	0.01348	0.01260	0.01245	0.01132	0.01132
	SNED	0.48488	0.36543	0.44762	0.45306	0.48488	0.01462	0.01263	0.01296	0.01146	0.01262
8	IBCF	0.12151	0.09387	0.08571	0.06712	0.05381	0.00628	0.00528	0.00542	0.00438	0.00419
	BIPS	0.11087	0.14986	0.11227	0.11903	0.11734	0.00423	0.00486	0.00490	0.00486	0.00421
	Probs	0.35481	0.35481	0.35481	0.35481	0.35481	0.00884	0.00884	0.00884	0.00884	0.00884
	CUNE	0.36228	0.36221	0.36228	0.36207	0.36207	0.00873	0.00895	0.00896	0.00890	0.00890
	TrustSVD	0.37320	0.36264	0.36412	0.36209	0.36357	0.00998	0.00944	0.00931	0.00953	0.00979
	SNED	0.38573	0.36366	0.38941	0.38573	0.36366	0.01129	0.00947	0.00947	0.01059	0.00991
10	IBCF	0.11686	0.07287	0.06667	0.06579	0.05217	0.00402	0.00348	0.00390	0.00375	0.00350
	BIPS	0.10588	0.09968	0.08981	0.09968	0.10469	0.00390	0.00418	0.00367	0.00418	0.00359
	Probs	0.31431	0.31431	0.31431	0.31431	0.31431	0.00468	0.00468	0.00468	0.00468	0.00468
	CUNE	0.31491	0.31491	0.31499	0.31376	0.31297	0.00632	0.00628	0.00602	0.00601	0.00601
	TrustSVD	0.31593	0.31564	0.31528	0.31514	0.31405	0.00708	0.00712	0.00708	0.00708	0.00708
	SNED	0.36213	0.31957	0.32976	0.32803	0.31447	0.00932	0.00803	0.00734	0.00767	0.00773
12	IBCF	0.09761	0.06279	0.06072	0.06136	0.04264	0.00342	0.00336	0.00327	0.00323	0.00315
	BIPS	0.09778	0.09022	0.08220	0.08876	0.09175	0.00312	0.00348	0.00348	0.00309	0.00300
	Probs	0.20645	0.20645	0.20645	0.20645	0.20645	0.00407	0.00407	0.00407	0.00407	0.00407
	CUNE	0.21073	0.21062	0.20759	0.20759	0.20759	0.00574	0.00562	0.00534	0.00534	0.00529
	TrustSVD	0.21194	0.21186	0.21077	0.21056	0.21040	0.00634	0.00631	0.00631	0.00609	0.00576
	SNED	0.29766	0.21491	0.24980	0.21453	0.21093	0.00697	0.00634	0.00669	0.00648	0.00581

表6 各算法在2个数据集上的Precision值对比 Table 6 Comparison of precision values of different algorithms on 2 datasets

各算法在2个数据集上的Recall、F₁值、P值分别如图6~图8所示.由图可知, 本文算法的指标值最高, 随着邻近物品数的增加, 逐渐趋于稳定.

	Figure Option View Download New Window
	图6 各算法在2个数据集上的Recall值对比Fig.6 Recall comparison of different algorithms on 2 datasets

	Figure Option View Download New Window
	图7 各算法在2个数据集上的F₁值对比Fig.7 F₁ comparison of different algorithms on 2 datasets

	Figure Option View Download New Window
	图8 各算法在2个数据集上平均精度值的对比Fig.8 Average precision comparison of different algorithms on 2 datasets

各算法在2个数据集上的MAE值和RMSE值对比如图9和图10所示.由图可知, 本文算法的预测精度值最低, 说明本文算法的预测精度最优, 随着邻近物品数的增加, 逐渐趋于稳定.

	Figure Option View Download New Window
	图9 各算法在2个数据集上MAE值的对比Fig.9 MAE comparison of different algorithms on 2 datasets

	Figure Option View Download New Window
	图10 各算法在2个数据集上RMSE值的对比Fig.10 RMSE comparison of different algorithms on 2 datasets

综合上述实验结果分析如下.对于新物品(新用户), 如果没有用户对该物品评级或评级分布稀疏, 很难找到与目标物品相邻的物品集, 导致推荐系统的精确度较低, 同时影响推荐质量和推荐系统的整体性能.本文算法利用复杂网络计算相似度, 在丰富用户之间社交化信息的同时有效解决上述问题.在社交网络中通过挖掘用户之间更深层的关系及通过混合网络有效计算物品之间的相似值.实验表明, 本文算法能有效提取目标物品的邻近物品集, 提高推荐系统的精确度和推荐质量, 解决目前推荐系统推荐精确度较低的问题.

4 结束语

在大数据与人工智能飞速发展的背景下, 本文提出基于社交网络能量扩散的协同过滤推荐算法, 结合信任朋友信息, 更好地挖掘用户之间的潜在社交信息, 同时结合协同过滤, 实现用户对未评分的物品进行预测评分, 向用户提供更精准的推荐.在Film-Trust、CiaoDVD数据集上的实验表明, 本文算法可大幅提高推荐系统的精确度, 从而提高推荐系统的推荐质量, 并且利用社交网络丰富用户之间的社交化信息、信任信息, 给用户更精准的推荐.今后将继续深入探索复杂网络对计算相似度及推荐结果的影响.

参考文献

文献选项

[1]	LU J, WU D S, MAO M S, et al. Recommender System Application Developments: A Survey. Decision Support Systems, 2015, 74(6): 12-32. [本文引用:1]
[2]	BOBADILLA J, ORTEGA F, HERNANDO A, et al. Recommender Systems Survey. Knowledge-Based Systems, 2013, 46(1): 109-132. [本文引用:1]
[3]	ELAHI M, RICCI F, RUBENS N. A Survey of Active Learning in Collaborative Filtering Recommender Systems. Computer Science Re-view, 2016, 20(2): 29-50. [本文引用:1]
[4]	SON J, KIM S B. Content-Based Filtering for Recommendation Systems Using Multiattribute Networks. Expert Systems with Applications, 2017, 89(2): 404-412. [本文引用:1]
[5]	THORAT P B, GOUDAR R M, BARVE S. Survey on Collaborative Filtering, Content-Based Filtering and Hybrid Recommendation System. International Journal of Computer Applications, 2015, 110(4): 31-36. [本文引用:1]
[6]	TIAN Y H, ZHENG B, WANG Y F, et al. College Library Perso-nalized Recommendation System Based on Hybrid Recommendation Algorithm // Proc of the 11th CIRP Conference on Industrial Pro-duct-Service Systems. Berlin, Germany: Springer, 2019: 490-494. [本文引用:1]
[7]	YU W, LI S J. Recommender Systems Based on Multiple Social Networks Correlation. Future Generation Computer Systems, 2018, 87(10): 312-327. [本文引用:1]
[8]	XU C H. A Novel Recommendation Method Based on Social Network Using Matrix Factorization Technique. Information Processing and Management, 2018, 54(3): 463-474. [本文引用:1]
[9]	LAI C H, LEE S J, HUANG H L. A Social Recommendation Me-thod Based on the Integration of Social Relationship and Product Popularity. International Journal of Human-Computer Studies, 2019, 121(1): 42-57. [本文引用:1]
[10]	KART O, ULUCAY O, BINGOL B, et al. A Machine Learning-Based Recommendation Model for Bipartite Networks. Physica A(Statistical Mechanics and Its Applications), 2020, 553(1). DOI: DOI:10.1016/j.physa.2020.124287. [本文引用:1]
[11]	ZHAO D Z, ZHANG L L, ZHAO W Q. Genre-Based Link Prediction in Bipartite Graph for Music Recommendation. Procedia Computer Science, 2016, 91: 959-965. [本文引用:1]
[12]	JIANG L L, CHENG Y T, YANG L, et al. A Trust-Based Colla-borative Filtering Algorithm for E-commerce Recommendation System. Journal of Ambient Intelligence and Humanized Computing, 2018, 10(8): 3023-3034. [本文引用:2]
[13]	ZHANG C X, YU L, WANG Y, et al. Collaborative User Network Embedding for Social Recommender Systems // Proc of the SIAM International Conference on Data Mining. Berlin, Germany: Springer, 2017: 381-389. [本文引用:2]
[14]	GUO G B, ZHANG J, SMITH N Y. TrustSVD: Collaborative Filtering with Both the Explicit and Implicit Influence of User Trust and of Item Ratings // Proc of the 29th AAAI Conference on Artificial Intelligence. Palo Alto, USA: AAAI Press, 2015: 123-129. [本文引用:2]
[15]	GOHARI F S, ALIEE F S, HAGHIGHI H. A New Confidence-Based Recommendation Approach: Combining Trust and Certainty. Information Sciences, 2018, 422(1): 21-50. [本文引用:1]
[16]	SHAMBOUR Q, LU J. An Effective Recommender System by Unifying User and Item Trust Information for B2B Applications. Journal of Computer And System Sciences, 2015, 81(7): 1110-1126. [本文引用:1]
[17]	ZHOU T, KUSCSIK Z, LIU J G, et al. Solving the Apparent Diversity-Accuracy Dilemma of Recommender Systems. Proceedings of the National Academy of Sciences of the United States of Ameri-ca, 2010, 107(10): 4511-4515. [本文引用:2]
[18]	任永功, 石佳鑫, 张志鹏. 融合关系挖掘与协同过滤的物品冷启动推荐算法. 模式识别与人工智能, 2020, 33(1): 75-85. (REN Y G, SHI J X, ZHANG Z P. Recommendation Algorithm Combining Interrelationship Mining and Collaborative Filtering for Items Cold Start. Pattern Recognition and Artificial Intelligence, 2020, 33(1): 75-85. ) [本文引用:1]
[19]	REN X L, LU L Y, LIU R R, et al. Avoiding Congestion in Re-commender Systems. New Journal of Physics[C/OL]. [2021-01-05]. https://iopscience.iop.org/article/10.1088/1367-2630/16/6/063057/pdf. [本文引用:1]
[20]	SARWAR B, KARYPIS G, KONSTAN J, et al. Item-Based Co-llaborative Filtering Recommendation Algorithms // Proc of the 10th International Conference on World Wide Web. New York, USA: ACM, 2001: 285-295. [本文引用:1]

2015

0.0

... 随着人工智能与大数据的飞速发展,推荐系统(Recommender System, RS)^[1]受到学者们的广泛关注 ...

2013

0.0

... 目前在RS中常见的推荐方法为协同过滤(Collaborative Filtering, CF)^[2]、基于内容过滤推荐算法和混合过滤推荐算法 ...

2016

0.0

... 如果在数据量较大且又稀疏的情况下,相似性计算的耗费会很大,也难以给用户精准推荐,影响推荐质量^[3] ...

2017

0.0

... Son等^[4]采用基于内容的协同过滤方法,构建多属性的网络,反映属性之间的关联,可缓解推荐系统的稀疏性问题,但挖掘属性有限,难以构造属性更丰富的网络 ...

2015

0.0

... 混合过滤算法中常见方法是混合基于内容过滤算法和CF,在一定程度上可提高推荐质量^[5] ...

2019

0.0

... Tian等^[6]结合高校图书和读者的特点,进行读者的分类和构建评分向量的空间模型,利用聚类方法结合两者,在一定程度上缓解数据稀疏问题,但未利用读者的社会信息,在分类问题上不具有全面性 ...

2018

0.0

... 基于社交网络推荐算法和基于图的推荐算法是目前较通用的推荐方式,通过引入社交网络信息、朋友信息,有效提高推荐质量,实现个性化推荐^[7] ...

2018

0.0

... Xu^[8]将矩阵分解技术(Matrix Factorization Techni-que)运用到社交网络中,并考虑各种复杂的因素及社会关系,提升推荐性能,但未深入挖掘用户在社交网络中的额外社会化信息,导致推荐结果不一定准确 ...

2019

0.0

... Lai等^[9]在社交网络的基础上提出基于用户信任关系和物品的流行度推荐算法 ...

2020

0.0

... Kart等^[10]提出基于监督机器学习的加权二部图链接预测模型,将用户的项目评论映射为二部图结构,并优化结构,提高预测质量,但未能有效缓解数据稀疏问题 ...

2016

0.0

... Zhao等^[11]提出改进二部图的方法,提取用户偏好的类型权重特征,结合用户的相似度构建推荐模型 ...

2018

0.0

... Jiang等^[12]融合信任数据与用户相似度并加入改进的推荐模型,未缓解数据稀疏问题,未显著提高推荐精确度 ...

... 3)基于信任协同过滤推荐算法(Trust-Based Collaborative Filtering, BIPS)^[12] ...

2017

0.0

... Zhang等^[13]利用评分信息构建隐式社交网络,通过图表示学习方法预测评分,但没有利用显式社会化信息,未能有效提高推荐精确度 ...

... 4)社交网络中利用图表示方法学习网络嵌入推荐算法(Collaborative User Network Embedding, CUNE)^[13] ...

2015

0.0

... Guo等^[14]提出社会化推荐算法,将评分信息和社交网络信息分解为低维特征矩阵进行预测评分,但降维时会导致信息缺失,未显著提高推荐精度 ...

... 5)基于信任的奇异值分解算法(Trust Based Sin-gular Value Decomposition, TrustSVD)^[14] ...

2018

0.0

... 为了让信任值结果更精准,将用户之间的评级值采用大小标准化方法^[15],将评级值标准化到[0,1]内 ...

2015

0.0

... 定义1 为了衡量用户之间直接信任强度,引入用户U_x对物品I_i的预测误差评分值Prediction error^[16] ...

2010

0.0

... 2 计算物品间的相似度经典的基于物品协同过滤算法通过用户间的共同评分计算相似度,本文算法结合社交网络和用户-物品二分网络^[17],计算物品间的相似度 ...

... bilistic Spreading, Probs)^[17] ...

2020

0.0

... 根据文献[18],邻近物品集取值为10、20、30、40、50 ...

2021

0.0

... 采用平均精度(P)衡量整个推荐系统的平均精确度^[19]: ...

2001

0.0

... 1)基于物品的协同过滤算法(Item-Based Colla-borative Filtering, IBCF)^[20] ...