0

0

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

WBOY

WBOY

发布时间:2023-05-03 16:01:07

|

2111人浏览过

|

来源于51CTO.COM

转载

近年来,以大数据和深度学习为基础的人工智能展示了卓越的计算能力和学习能力。但深度学习模型通常包含深度嵌套的非线性结构,很难确定具体哪些因素使它做出这样的决定,缺乏决策的可解释性和透明度。

与此同时,由于可解释的建议不仅提高了推荐系统的透明度、可解释性和可信度,而且还提高了用户满意度,可解释性推荐任务受到越来越多研究人员的关注[1]。

而随着深度学习方法和语言处理技术的发展,在提供个性化推荐时,很多方法利用自然语言生成技术生成自然文本解释[2-3]。但是由于数据稀疏性,难以生成高质量的文本解释,可读性差。

另外,因为知识图可以包含更多的事实和联系,一些研究人员利用知识图进行推荐,并通过图推理路径增强推荐的可解释性[4-5]。但基于图路径的方法需要一些前提条件或定义,例如预先定义路径或数据集存在多种类型的关联,同时知识图谱可能包含冗余实体,从而导致同质化推荐结果。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

论文链接:https://ieeexplore.ieee.org/abstract/document/9681226

小羊标书
小羊标书

一键生成百页标书,让投标更简单高效

下载

为此,作者提出了一种新的知识增强图神经网络(KEGNN)实现可解释性推荐。

KEGNN利用外部知识库中的语义知识,从用户、商品和用户-商品交互三个方面学习知识增强语义嵌入。

从用户-商品交互的角度出发,构造用户行为图,并利用知识增强的语义嵌入对用户行为图进行初始化。

然后提出基于图神经网络的用户行为学习和推理模型,该模型通过传递用户的偏好信息,对用户行为图进行多跳推理,从而全面理解用户行为。

最后设计了层次化协同过滤层进行推荐预测,并将拷贝机制与GRU的生成器相结合,生成高质量、人类可读的语义解释。作者已经在三个真实数据集上进行了广泛的实验。实验结果表明,KGNN优于现有方法。

方法

作者提出了知识增强的图神经网络实现可解释性,所提出的方法的体系结构如图1所示。

它主要包括四个模块:知识增强语义表示学习、基于图形神经网络的用户行为学习与推理、层次化协同过滤和文本解释生成。

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

模块1:为了学习用户、商品和用户-商品交互的语义表示学习,作者按照时间顺序池化聚集了用户和商品评论文档,形成三种类型的文本文档,分别表示为用户、商品和用户-商品交互。

对三种文档进行了进一步的知识增强语义表示学习,图2给出了知识增强语义表示学习模块的结构。

首先,上下文表示部分中先学习词级嵌入表示和语义上下文表示,利用BiLSTM对词级嵌入的顶层进行全局化捕捉,得到层次化语义表示。其次在知识感知中作者利用知识库来增强语义表征学习。

此外,作者用one-hot代表用户/商品编码,采用全连接层映射将稀疏的one-hot表示转换为密集表示作为用户/商品的固有表示,最后,采用多头注意力进一步融合知识感知表示和用户/商品的固有表示输出知识增强的用户/商品/用户-商品交互表示。

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

模块2:为了全面了解用户偏好,作者设计了一个基于图神经网络的用户行为学习和推理模块,包括用户行为图构建、信息传播层和多跳推理三个步骤,如图3所示。

首先,从用户-商品交互关系,作者构造用户行为图,并且利用知识增强的语义表示初始化用户行为图的节点表示和边表示。

其次,基于图神经网络的架构,作者设计了基于GNN信息传播层捕捉用户行为间的一阶邻接网络(ego-network)的信息传播及信息融合。

最后,采用递归方式利用多跳(multi-hop)推理对图结构的高阶连接信息进行建模。

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

模块3:作者基于神经协同过滤框架设计层次化神经协同过滤算法,如图4(a)所示,主要包括三层神经协同过滤层实现用户-商品交互预测。

在第一个神经协同层是全连接层,用户行为图学习和推理中获得的用户表示商品表示拼接起来作为输入,输出第一层用户-商品交互表示,如公式1:

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

(公式1)

在第二层,我们设计了一个关系感知神经网络层,融合用户-商品关系表示和第一层的输出。

采用两种融合方式,分别为阿达玛乘积(如公式2)和全连接层非线性融合(如公式3),分别输出关系感知的用户-商品交互表示和高层次交互表示:

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

(公式2)

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

(公式3)

第三层采用关系感知用户-商品交互表示和高层次交互表示作为输入,实现评分预测,如公式4所示:

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

(公式4)

模块4:结合生成模型和拷贝机制(生成模式和拷贝模式),作者设计一个新颖的文本解释生成模块,生成高质量的人类可读解释。

图4的右侧部分演示了此模块的详细信息。应用循环神经网络GRU作为解释生成器;另外引入拷贝机制从用户原有评论中抽取信息,结合两种模式(生成模式和拷贝模式)生成直观文本解释(词序列),易于用户阅读理解。

实验

数据集选择

本文使用Amazon5 core的三个数据集,分别是电子、家庭-厨房以及音乐-设备。评级范围为[0,5]。对于所有数据集,作者随机选择每个数据集中80%的用户-商品交互作为训练集,10%的用户-商品交互作为测试集,剩余的10%的用户-商品交互被视为验证集。

评分预测性能

方法对比中,作者将KEGNN与CTR、PMF、NARRE、NRT、GCMC、LightGCN、RippleNet进行对比(计算各个方法的RMSE和MAE),如图所示。

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

从结果可以看出,对于所有数据集,作者的方法KEGNN在MAE和RMSE上都优于所有比较方法。

解释生成质量

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

从结果中可以看出,作者方法在精度和F1指标上有着最好的表现,但是召回率却不如CTR或者NARRE。质量评估结果表明,作者生成的文本解释类似于与处理行为相关的基本事实评论,并揭示了处理行为背后的隐含用户意图。作者还在接下来在案例分析中对可解释性进行了进一步调查。

案例分析

中科院深圳先进院:全新知识增强图神经网络实现可解释性推荐

作者选择一些案例展示生成解释的可解释性,所选案例均来自测试集,因此,在解释生成过程中隐藏了真实文本,三个数据集的典型案例如上表格所示,Ground表示用户给出的真实评论。

从案例研究中,我们可以看到作者的方法生成的解释说明了用户对评级商品的选择和购买原因。可解释的概念和方面以粗体斜体突出显示,表示用户行为的潜在意图,并展示推荐结果的可解释性。

结论

本文提出了一种基于知识增强图神经网络(KEGNN)的可解释推荐方法,该方法利用外部知识库中的语义知识来增强用户、商品和用户-商品交互三方面的表示学习。

作者构造了一个用户行为图,并设计了一个基于图神经网络的用户行为学习和推理模块,用于全面理解用户行为。

最后,利用GRU生成器和拷贝机制相结合生成语义文本解释,利用层次化神经协同过滤实现精准推荐。详细内容请参见论文细节。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

89

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

276

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

59

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

99

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

619

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

173

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 1.0万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号