网站建设设计费会计分录,汉中专业网站建设推广,怎么做的网站收录快,城阳做网站找哪家本文转载自#xff1a;RUC智能情报站#xff0c;知乎专栏链接#xff1a;https://zhuanlan.zhihu.com/RucAIBox前言#xff1a;近年来#xff0c;知识图谱#xff08;KB#xff09;被广泛应用于推荐系统#xff08;RS#xff09;#xff0c;但尚未有公开将推荐系统物… 本文转载自RUC智能情报站知乎专栏链接https://zhuanlan.zhihu.com/RucAIBox前言近年来知识图谱KB被广泛应用于推荐系统RS但尚未有公开将推荐系统物品链接到知识图谱实体的数据集。本文结合SIGIR2018论文《Improving Sequential Recommendation with Knowledge-Enhanced Memory Networks》所用数据集 [1]公布了相关链接数据集 [2]希望能对大家有所帮助。一、动机/引介近年来学术界和工业界都致力于利用结构化的知识信息和相关领域的已知事实来提升各项应用。在众多数据形式中知识图谱高度结构化能够有效组织和关联相关实体被广泛运用到各个领域。推荐任务中利用知识图谱提升推荐的质量和可解释性相关的推荐系统被称为knowledge-aware recommender systems。为了适应推荐系统和知识图谱相关研究需求本工作启发式地将推荐数据中的物品链接到大型知识图谱中的实体为推荐系统的物品提供蕴含丰富语义的结构化知识信息。本工作将其整理发布为公开的推荐系统-知识图谱链接数据集KB4Rec v1.0。二、数据集概况KB4Rec v1.0数据集构建了推荐系统数据集物品RS item到知识图谱实体KB entity的链接。在推荐系统方面选取了三个得到广泛使用的数据集MovieLens 20M [3]、LFM-1b [4]、Amazon book [5]分别对应电影、音乐和书籍三个领域在知识图谱方面选取了研究者常用的Freebase [6]。KB4Rec v1.0数据集由链接的ID对组成包括推荐系统的物品ID和Freebase中的实体ID。链接文件片段电影数据集合MovieLens 20M如下所示 25991 m.09pglcq25993 m.0cjwhb25994 m.0k44325995 m.0b7kj8通过此链接能够找到部分推荐系统中物品在知识图谱内对应的实体并通过读取与该实体相关的三元组获取相应的属性。举个例子电影“阿凡达”通过链接找到相应实体读出与之相关的三元组能够在知识图谱中找到相应的演员、导演等属性。链接数据集三个领域的数据统计见下表三、链接分析可以看到不是所有推荐系统中的物品都能够在Freebase中找到对应的实体。对于各领域链接比例linkage ratio本工作参照各推荐领域内物品流行度做了相关分析其中物品流行度由推荐数据中与物品有交互记录的用户数代表。首先将推荐系统中的物品按流行度升序排序等分到5个桶bin中展示相应部分链接比例。如下图可以发现流行度高的物品更倾向于被Freebase所包含。针对MovieLens 20M数据集还对电影的发布时间与链接比例做了分析。对所有电影按发布时间升序排序等分到10桶bin中展示相应链接比例。如下图所示可以发现越早发布的电影越倾向于被Freebase所包含。四、数据获取本工作将相关项目部署在github上数据的获取和使用需遵照相关证书license。更多链接和数据集构建的细节请参照我们的相关论文 [2]。五、相关论文[1] Jin Huang, Wayne Xin Zhao, Hong-Jian Dou, Ji-Rong Wen, Edward Y. Chang : Improving Sequential Recommendation with Knowledge-Enhanced Memory Networks. SIGIR 2018: 505-514[2] Wayne Xin Zhao, Gaole He, Hongjian Dou, Jin Huang, Siqi Ouyang and Ji-Rong Wen : KB4Rec: A Dataset for Linking Knowledge Bases with Recommender Systems. Arxiv 1807.11141.[3] F. Maxwell Harper, Joseph A. Konstan : The MovieLens Datasets: History and Context. TiiS 5(4): 19:1-19:19 (2016)[4] Markus Schedl : The LFM-1b Dataset for Music Retrieval and Recommendation. ICMR 2016: 103-110[5] Ruining He, Julian McAuley : Ups and Downs: Modeling the Visual Evolution of Fashion Trends with One-Class Collaborative Filtering. WWW 2016: 507-517[6] Google : 2016. Freebase Data Dumps. https://developers.google.com/freebase/ data.本文作者何高乐2018级研究生目前研究方向为网络表示学习、深度学习来自中国人民大学大数据管理与分析方法研究北京市重点实验室。RUC 智能情报站由中国人民大学信息学院的赵鑫副教授 (微博 赵鑫RUC) 所带领的研究小组维护。关注的领域是数据挖掘、社会计算和机器学习。该专栏会定期会分享相关学术内容欢迎各位来邮件进行交流也欢迎大家向该专栏投稿精品文章。知乎账号联系人为 窦洪健负责资讯、投稿、宣传以及一切账号相关问题邮箱为43404873qq.com企业和转载合作需求请致谢赵鑫老师邮箱为 batmanflyqq.com。赵鑫老师个人情况详见个人主页 http://playbigdata.com/batmanfly 和 http://info.ruc.edu.cn/academic_professor.php?teacher_id55 。OpenKG.CN中文开放知识图谱简称OpenKG.CN旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。