搜档网
当前位置:搜档网 › 基于标签的个性化推荐系统研究进展

基于标签的个性化推荐系统研究进展

基于标签的个性化推荐系统研究进展
基于标签的个性化推荐系统研究进展

基于标签的个性化推荐系统研究进展1)

张富国1,2

(1.江西财经大学信息管理学院,江西南昌330013; 2.瑞士弗里堡大学物理系交叉学科组,弗里堡CH-1700)

摘要数据稀疏性多年来一直是困扰传统推荐系统性能表现的一个大问题,社会化标签为推荐系统获得用户的偏好信息提供了一个新的数据来源,同时也对传统的基于二维数据的推荐技术提出了新的挑战。近年来,基于标签的个性化推荐技术研究逐渐受到比较多的关注。本文从社会化标签系统的概念模型、用户兴趣模型表示、基于标签的个性化项目推荐方法、典型社会化标签系统实例及其数据集的取得等进行前沿概括、比较和分析。最后,对基于标签的推荐系统有待深入的研究难点和发展趋势进行了展望。

关键词社会化标签系统推荐系统兴趣偏好推荐方法

Research and Development on Tag-based Recommend

Recommender er Systems

1,2

ZHANG Fu-guo

(1.School of Information Technology Jiangxi University of Finance&Economics,Nanchang330013China;

2.The Interdisciplinary Physics Group,Physics Department,University of Fribourg,CH-1700Fribourg,Switzerland) Abstract Data sparsity is a major problem which causes the decline of the recommendation performance in the recommender systems.Social tags provide a new data resource for recommender systems to obtain users’preference information,and traditional recommendation technology based on two dimensions datum is facing a new challenge.In recent years,the research on personalized recommendation technology has been paid more attention.This paper presents an overview of tag-based recommender systems, including concept model,user interest model,tag-based recommendation methods,typical social taging systems and the way to obtain their datasets.Finally,the prospects for future development and suggestions for possible extensions are also discussed. Keywords social taging system,recommender system,preference,recommendation method.

1引言

互联网技术的迅猛发展把我们带进了信息爆炸的时代。海量信息的同时呈现,一方面使用户很难从中发现自己感兴趣的部分,另一方面也使得大量少人问津的信息成为网络中的“暗信息”,无法被一般用户获取[1]。个性化推荐系统的出现为用户处理信息过载问题提供了一个有效的工具,同时,推荐系统也能帮助商家把用户的潜在需求转化为现实需求,从而达到提高商家产品销售量的目的。实际的推荐系统应用也证明了这点,Amazon宣称35%的产品销售额来源于推荐[2],而Netflix宣称大约有60%的出租业务来源于推荐[3],因此即便是推荐质量上的稍小改进也会对此类公司产生巨大的商业利润,于是,Netflix公司在2006年悬赏100万美元用于奖励提高其推荐准确率10%的研究人员。从推荐技术来看,基于内容的过滤方法(Content-based)[4-6]受限于不能对非文本类对象进行信息的自动提取;而被认为是很有前途,也是关注最多的协同过滤(Collaborative Filtering)[7-10]推荐方法以及最近兴起的基于用户—产品二部图网络结构的推荐方法[11-14]都依赖于用户对项目的评分矩阵或关联关系。但从实际的推荐系统来看,由于评分数据的极端稀疏性(如:Netflix Prize数据集480189个用户对17770电影进行评分,评分值只有100,480,507个,近99%的评分未知),使得推荐系统无法准确获知用户的偏好,巧妇难为无米之炊,导致推荐系统性能的大

收稿日期:

作者简介:张富国,男,1969年生,副教授,主要研究领域为个性化推荐、信息检索。

资助项目:江西省教育厅科技计划项目(GJJ.10696)资助。

幅下降[7,15,16]。

在Web2.0下,用户会搜集自己感兴趣的资源并对其添加标签,以方便管理个人目录和搜索有用信息,因为其简单、易用等优点而逐渐成为Web2.0环境下一个比较流行的应用,在企业界出现了各种各样的社会化标签系统,比如Delicious、Flickr、Bibisonomy和豆瓣等。社会化标签既是信息资源的分类工具,也是用户个人偏好的反映,因此,社会化标签为推荐系统获得用户的偏好信息提供了一个新的数据来源,同时对传统的基于二维数据的推荐技术提出了新的挑战。近年来,社会化标签系统推荐的对象包括标签、用户和项目资源[17],前者研究的文献最多,后者作为一个较新的研究领域,也逐渐受到学术界的广泛关注,本文分析的就是对项目资源的推荐。

目前,国内外在该领域的综述性文献还很少见,本文在分析社会化标签的概念模型之上,详细分析讨论了用户偏好的表示方法、基于社会化标签的个性化推荐方法以及相关社会化标签系统实例及其实验数据集的获得方式,最后,指出了这些系统存在的缺陷和未来可能的若干研究方向。我们将该领域的研究进展和趋势介绍给信息科学工作者,希望能促进我国在该领域的研究工作。

2社会化标签系统的概念模型

目前,国内外对社会化标签的概念还没有统一的定义,但学者们普遍认同社会化标签是由用户产生的,对网络内容进行组织和共享的自下而上的组织分类体系[18]。相比较之前的系统,对资源进行科学分类大多是依靠少数领域专家,这种方法虽然比较科学和权威,但是不能很好的表达用户的个人想法和观点,而这一点也是社会化标签受到普遍欢迎的原因。

一个社会化标签系统由用户、项目和标签三类对象构成,它的概念模型如图1所示[19],用户可以对项目标注多个标签,标注的方法主要有两种:一种是手工标注,完全由用户从自己的词表中选择合适的词来标注资源;另外一种就是半自动标注,即社会化标签系统为用户推荐标签列表,用户从中选择合适的标签进行标注。这种标注关系的形式化表示为:},....,,,,{F 21t tag tag tag item user =,其中t表示用户对项目使用的标签数。在图1中,项目之间的有向虚线连接表示项目之间可能存在着的关联关系(比方说文献之间存在互相的引用关系);相类似的,用户之间的无向虚线连接用来说明某些用户之间可能存在的关联关系(比方说处在同一社会网络群组或同一部门下,如果用户是处在信任网络中,它就是个有向连接)。

Users Items

T a g s

图1社会化标签系统的概念模型

从社会化标签在标识项目方面的功效来说,文[20]

将其归纳为以下七种:

(1)标识对象的内容主题。一般用名词,如:IBM,Music,房产销售等标签。

(2)标识对象的载体类别。如:标识对象是文章,日志或书籍。

(3)标识对象的创建者或所有者。

(4)标识对象的品质和特征。如:有趣,幽默等标签。

(5)自己参考用的标签。如:myphoto、myfavourite等标签。

(6)分类提炼用的标签。如用数字标签对现有分类进一步细化。

(7)用户任务组织的标签。如:to read,to print等标签。

第1类和第4类社会化标签最能体现用户的兴趣所在,而第5类和第7类社会化标签则对反映用户的兴趣

没有多大帮助,在进行推荐过程中应该预先清理。

3基于标签的用户兴趣模型表示

社会化标签系统通过标签将用户和资源连接起来,通过三者的动态关系,可以分析出用户的兴趣偏好。标签对用户偏好的表达与以往推荐系统中的评分数据相比有它的优势和缺点。从优势来说,对某个对象的社会化标签一般是若干个单词或者短语,相较于具体的评分值,前者携带有更多的信息量。比如在电影推荐中,对于电影“泰坦尼克”,在传统的推荐系统中,如果用户很欣赏这部电影,他会给五颗星,但是表达的含义是不清楚的。但是在标签推荐系统中,你可以为这部电影添加“永恒的爱”或是“灾难”等标签,这样系统就可以清楚用户关注电影的哪几个方面[21]。在缺点方面,大多数社会化标签系统允许用户自行输入标签,由于标注的随意性也造成了标签中存在较多噪音,如同义词、歧义词以及私人标签(Bischoff等的调查发现:接近60%的标签只被一个用户使用[22])。这些噪声给基于标签的个性化推荐系统研究带来了挑战。

社会化标签这种隐式的评级机制依赖于推荐系统对标签本身的语义的理解,许多研究致力于通过调查用户标签行为来获得用户标签词汇的演化模型[23-25]。这些研究发现用户的标签行为除了受用户个人的偏好影响之外,还受到了整个社区普遍的标签行为的影响。也就是说,兴趣相似的用户(同一社区成员)很可能使用相似的标签,这对在标签系统中根据用户兴趣进行推荐提供了很好的基础。

基于标签的用户兴趣模型表示方法可以概括为简单向量法[26,27]、共现法[28]、自适应法[29]和多兴趣模型[30]四类,具体介绍如下。

(1)简单向量法(Naive approach):简单向量法认为如果一个用户使用某个标签的次数越多,说明她在相应主题上的兴趣度越高,所以最简单的方法就是用标签向量来表示用户概貌,先统计出整个系统中最常用的k个标签,然后统计目标用户在这些标签上的使用次数,构成标签向量。

这种方法的优点是容易实现,但它有两方面的缺点,一是某些常用的单个标签缺少语义的明确性,不能体现用户的个性化偏好,比如标签“Web”等;二是用户在对具体对象进行标签时,同时使用了多个标签,它们之间存在着一定的语义联系,向量型的离散表示不能刻划标签之间的这种语义联系。

(2)共现法(Co-occurrence approach):为了弥补简单标签向量语义松散的不足,共现法利用社会网络分析中的共现技术,来揭示标签之间的语义关系。它的基本思想是:有两个标签,如果同时被部分人使用在标注一些对象上,那说明这两个标签之间存在着某种语义上的关系[24]。我们可以用一个无向图来表示,其中的节点表示标签,边表示两标签的同时出现,边的权重表示同时出现的次数,多出现一次就多加1。最后,选出权重最大的k个标签对,来表示用户兴趣向量模型。

共现法体现了标签之间的语义关系,但单纯依靠这种处理方式忽略了某些用户频繁使用单一标签的情况,所以一种弥补的策略是综合考虑简单向量法和共现法,在标签节点图中既计算单个标签节点的权重,也计算节点边的权重,最后选择单个标签节点中权重最高的N个标签和标签边权重最大的M个标签边作为用户概貌的表示量[24]。

(3)自适应法(Adaptive approach):自适应法在共现法的基础上考虑了用户兴趣随时间的变化情况,利用蚁群算法中的蒸发技术[31]来揭示用户的短期兴趣,但其与共现法一样并未特别考虑单个标签的权重。

(4)多兴趣模型(Multi-interest model):由于用户在不同领域的多兴趣,很难通过一个向量来表示,

Yeun g等设计了一个算法,先通过聚类方法,使对象和标签归属到不同的主题,然后考察用户的标签集,确定用户在各个兴趣主题下的标签向量。

还有一些学者提出使用组合方法[32]来构建用户的多兴趣模型,取得了一定的效果,但其往往规模较大,

计算复杂性高。

标签对用户兴趣的反映和在推荐系统中的应用,离不开对标签语义的深入理解,为此,不少研究人员

关注于研究标签之间的语义关系。斯坦福大学的Heymann和Garcia-Molina设计了一个算法可以把社会

化标签系统的标签集转化成一个层次标签树[33]。Shen和Wu用概率模型来描述用户的标签行为,并从中导

出标签之间的语义关系[34]。Capocci和Caldarelli通过把用户、对象和标签的三部图模型映射到标签网

络,来研究标签共同出现的规律,发现可以用集聚系数(clustering coefficient)来表示标签之间的语

义关系[35]。Huang等用相对共现度来衡量标签之间的语义关系,相对共现度值等于两个标签共同出现的对

象个数除以至少出现其中一个标签的对象个数。两个标签一起描述同一对象的次数越多说明两者的语义关系越紧密[36]。

4基于标签的项目推荐方法

如何充分利用标签数据对用户兴趣偏好的反映,结合传统的项目、评分二维数据进行个性化的项目推荐,是基于标签推荐系统的关键。到目前为止,有很多研究致力于在社会化标签系统中进行标签的推荐

[37,38],而以项目推荐为目标的研究在最近几年也开始有了一定的进展,我们把基于标签的项目推荐方法分为协同过滤扩展方法、三部图推荐方法、PLSA 推荐方法和张量分解方法。

4.1协同过滤扩展方法

为了使用协同过滤方法来实现结合标签的推荐算法,Zeng 和Li 采用类似于简单向量法对用户兴趣的表示方式,通过标签的TF-IDF 权重向量来计算用户和项目之间的相似性,然后利用协同过滤方法进行网页的推荐[39],但这种简化方法限制了推荐方法的性能表现。Zhao 等利用用户之间标签集的语义距离来度量两者的相似性,再进行相似邻居的选择[40]。除此之外,文[41,42,43]也分别提出了不同的融合标签的相似性度量方法。Markines 等系统地对多种不同的相似性度量方法进行了实验评估,结果发现这些方法不能兼顾准确性和计算复杂性,具有高准确性的度量方法,它的计算复杂性也很高[44]。

Tso-Sutter 等把用户、评分和标签的三元关系映射成三个两两关系:,然后通过把用户项目评分矩阵在水平或垂直方向进行延伸,如图2所示,User tags 是用户标注项目时用到的标签,在用户项目评分矩阵中被看做是扩展的项目,而Item tags 是标注某一项目时用到的标签,在用户项目评分矩阵中被看做是扩展的用户。考虑到标签一方面是对项目资源的描述,另一方面也是用户兴趣的反映,融合User-based 和Item-based 的推荐方法[45]被Tso-Sutter 等用作项目的评分预测,文[46]的实验结果也表明,在扩展模型基础上单纯使用User-based 方法或Item-based 方法对提供推荐的准确性几乎没有帮助,但基于两者融合的方法则有比较显著的提高。

图2化三部图为用户项目评分矩阵4.2三部图推荐方法

近年来,也有不少研究人员从图形相关理论出发进行标签相关信息的推荐,主要有FolkRank推荐方法

[47,48]和基于三部图网络结构的推荐方法[49]。

4.2.1FolkRank推荐方法

FolkRank 推荐方法的思想来源于PageRank [50],后者基于“从许多优质的网页链接过来的网页,必定还是优质网页”的回归关系,来判定所有网页的重要性。相类似的,FolkRank 推荐方法的核心思想是由自己偏好的标签和自己喜欢的用户关联的项目资源,被自己偏好的可能性更大。

在FolkRank推荐方法中,社会化标签系统被看作是一个无向的、带权三部图G F =(V F ,E F ),其中

R T U V F ∪∪=,}),,(|},{},,{},,{{Y r t u r u r t t u E F ∈=,而边的权重的定义方式为:|}),,(:{|),(Y r t u R r t u ∈∈=ω,items users

item tags users

items

user tags

表示用户u 使用t 做标签的总次数;同样地,),(r t ω表示用标签t给对象r做标签的用户数,),(r u ω表示用户u给对象r做标签的标签个数;在此基础上,用邻接矩阵A(规范化为每一行值之和为1)表示G F 。在改进PageRank迭代公式p d dA r r r )1(?+←ωω中,为了体现用户的偏好,p r 中元素的值不再全是1,而是对于用

户偏好主题下的元素(如某些标签)给以更高的权重值,其他元素则对应同样小的权重。用0ωr 表示当调整参

数d=1时迭代计算得到的ωr 值,而用1ωr 表示d<1时迭代计算得到的ωr

值,则用户的最终偏好向量为10-ωωωr r r =。最后,根据此向量得出用户的项目推荐列表。

4.2.2基于网络结构的推荐方法

利用用户、产品二部图(bipartite network)来建立用户和产品的关联关系,并据此提出基于网络结构的推荐算法,开辟了推荐算法研究的一个新方向[1]。张翼成等考虑到用户对产品的打分信息,在更复杂的网络环境下,实现了基于网络结构的物质扩散[51]和热传导[52]推荐算法,实验结果证明这些算法的推荐效果明显好于经典的协同过滤。周涛等更是利用热传导和物质扩散的混合推荐算法,罕见地解决了推荐准确性和多样性不可兼得的矛盾[53],但基于网络结构的推荐方法与协同过滤相比,在推荐解释性[54]方面难度更大。

基于二部图方法在用户、产品二维关系上的成功,张子柯等把社会化标签系统看做是由用户—项目、项目—标签二个二部图组成的三部图,提出了基于标签的扩散推荐算法[49]。在该算法中,二个二部图分别用二个邻接矩阵表示,如果用户U i 对项目I j 做个标签,则a ij =1,否则a ij =0;类似的,如果项目I j 被某个用户做过标签T k ,则'

jk a =1,否则为0。然后,分别对这两个二部图使用物质扩散方式的资源分配策略,得到各

个项目的资源分配向量'f r 和''f r ,最终的分配值由公式1决定,其中可调参数]1,0[∈λ。

''')1(f f f r r r λλ?+=?(1)

在https://www.sodocs.net/doc/7e4056544.html,,MovieLens 和BibSonomy 三个数据集上的实验也说明该推荐方法在准确性、多样性和新奇性方面有了明显的提高。张子柯等进一步提出了基于网络结构的冷启动解决方法[55]。与需要不断迭代的FlokRank方法相比,基于网络结构的推荐方法每个二部图只需要三轮迭代,所以计算复杂性要小。

4.3PLSA推荐方法

协同过滤扩展方法的缺点是没有考虑标签之间的语义关系,而概率潜在语义分析方法(PLSA)则把语义关联的标签统一在引入的隐含主题变量{Z=z 1,z 2,…,z k }上。PLSA是由Hofmann于1999年提出的,它起源于自

然语言处理研究,是潜在语义分析(Latent Semantic Analysis,LSA)的强化和推广[56]。它将潜在语义以概率的形式表示,通过奇异值分解(SVD)将高维度的词汇—文档共现矩阵映射到低维度的潜在语义空间,使得表面毫不相关的词体现出深层次的联系。PLSA拥有坚实的数学基础及易于利用的数据生成模型,且已被证实能够为信息提取提供更好的词汇匹配。

在PLSA推荐方法[57]中,用户对各个主题的兴趣度不一样,而项目又是属于不同的主题的。项目i m 被用户u l 感兴趣的概率P(i m |u l )可以通过公式2计算得到。

∑=k l k k m l m u z P z i

P u i P )|()|()|((2)

其中P(i m |z k )是项目i m 属于潜在主题z k 的概率,而P(z k |u l )是用户u l 对潜在主题z k 感兴趣的概率。类似公式2,

标签和项目之间的概率关系P(i m |t n ),它的计算如公式3所示。

∑=k n k k m n m t z P z i P t i P )

|()|()|((3)

根据文[58]中的步骤,利用Maximum Likelihood准则,得到目标函数如式4所示。

]

)|(log ),()1()|(log ),([∑∑∑?+=n n m n m m l l m l m t i P t i f u i P u i f L αα(4)

可以用期望最大化算法(EM)[59]来求解该似然函数的参数估计问题,包括两个步骤:

(1)E步:计算当前参数状态下隐变量Z的后验概率,如式5和式6所示。

)|()

|()|(),|(l m l k k m m l k u i P u z P z i P i u z P =(5)

)

|()

|()|(),|(n m n k k m m n k t i P t z P z i P i t z P =(6)(2)M步:更新参数,使得对数似然函数最大化,如式7、式8和式9所示。

(|)(,)(|,)

k l l m k l m m P z u f u i P z u i ∝∑(7)

(|)(,)(|,)

k n n m k n m m

P z t f t i P z t i ∝∑(8)∑∝l

m l k m l k m i u z P i u f z i P )

,|(),()|(α(1)(,)(|,)

n m k n m n f t i P z t i α+?∑(9)

以上两个步骤的不断迭代,最终取得参数α的值,然后通过公式2计算P(i m |u l )值,概率值大的前N项作为用户的TOP N推荐列表项目。

4.4张量分解推荐方法

在NetPrize挑战竞赛中,大部分表现最优秀的算法是基于矩阵或张量分解的[60],既然社会化标签系统也可以看做是三阶张量,所以不少研究人员尝试用基于SVD(Singular Value Decomposition)[61]技术的张量分解(Tensor Factorization)方法来解决推荐问题[62-65]。张量分解推荐方法也体现出了比现有推荐技术如协同过滤、FolkRank和PageRank等方法更好的推荐准确性[66]。

张量分解方法一般包括张量分解模型的建立、各矩阵参数的计算和偏好预测值的计算三个步骤。下面简要介绍如下。

社会化标签系统可以定义为三阶张量|I |||||,,)(××∈=ΥT U r t u R a ,对于a 的取值问题,比较多的一种定义方式是:如果用户u 对项目i 做过标签t ,则值为1,其余为0,如式10所示[63]。

{Y t u t u a ∈=)i ,,(,

1,0i ,,其他(10)

图2社会化标签系统中的两种张量表示法比较大部分的张量分解推荐方法是基于Turker分解[67]的,它的张量分解模型可以用公式11表示,三阶张量Y被分成三个低秩矩阵||U U K U ∧×∈ ,||T T K T ∧×∈ ,||R R K R ∧×∈ 和一个核心张量U R T K K K C ∧××∈ [68]。∧∧∧∧∧×××=T I U C Y t i u (11)items

items

其中,,U R T K K K 为低秩逼近的维度值,x ×表示张量和矩阵之间的x维上的乘积运算[62]。

Symeonidis等利用HOSVD(High Order Singular Value decomposition)[69]方法对模型11进行参数C ∧、U ∧、

I ∧和T ∧的调优计算,接着按照式12计算用户对项目和标签的偏好预测值

[63]。),(),(),(),,(,,...∧∧∧∧∧∧∧∧∧∧∧∧∧∧∑∑∑=t t i i u i t

u u t i u t i u t i u c y (12)

Panagiotis 等在HOSVD方法基础上结合Kernel平滑技术来降低数据的稀疏性以及处理新数据来临时的模型更新问题[70]。Rendel等则提出了RTF(Ranking with Tensor Factorization)方法对HOSVD方法作了以下两个方面的改进[62]。

(1)初始张量表示方式的改进。就像在传统的项目评分矩阵中,不能简单地把用户未评分的项目和评分非常差的项目等同,都取最低分一样,在张量模型中,对于用户尚未做过任何标签的项目,a u,t,i 应设为未知值“?”,而对用户已经做过标签的项目,则对已选择的标签取正数值,反之取负数值,如图2所示,左边部分为[63]定义方式,右边部分为[62]的定义方式。

(2)HOSVD方法缺少适当的规则防止过度拟合(Overfitting),而过度拟合问题在机器学习里面是非常重要的。

RTF通过引入AUC值来优化模型参数,基于BibSonomy和Last.fm两个数据集的实验也表明:RTF算法在推荐质量(Precision和Recall)方面大大优于HOSVD、FolkRank和PageRank等算法。

大部分的张量分解模型是基于Turker分解的,但它的一个缺点是在大数据集上计算复杂性和空间复杂性很高。Rendle利用PARAFAC(Parallel Factor Analysis)分解建立张量分解模型,实现推荐,称作PITF(PairWise Interaction Tensor Factorization)算法,该算法不仅降低了计算的复杂性,而且在推荐准确性上超过了RTF等算法,但该算法在训练数学模型方面较费时间,而且需要寻找到合适的学习函数

[67]。

5社会化标签系统实例及其实验数据集

社会化标签系统具有的灵活性和开放性使其无论在研究领域还是在实际应用领域都有了一些著名的站点[21]。

(1)Delicious:Delicious 是由约书亚·沙克特(Joshua Schachter )于2003年创办的一个提供社会标签服务的网站,2005年被Yahoo 收购,Delicious 提供了一种简单共享网页的方法,它为无数互联网用户提供共享及分类他们喜欢的网页书签。

(2)Bibsonomy:BibSonomy 是一个分享标签和文献的系统。系统允许用户为自己发现的网页或者学术出版物赋予标签,以帮组用户组织和检索相关的标签或出版物。

(3)Flickr:Flickr 是一个以图片服务为主要的网站,它提供图片存放、交友、组群、邮件等功能,其重要特点就是基于社会网络的人际关系的拓展与内容的组织。Flickr 提供全面的、一流的和高效的图片服务,包括图片的上传与存放、分类、加标签、图片搜索等,2005年被Yahoo 收购。

(4)MovieLens :MovieLens 是历史最悠久的推荐系统。它由美国Minnesota 大学计算机科学与工程学院的GroupLens 项目组创办,是一个非商业性质的、以研究为目的的电影推荐实验性站点。2006年,MovieLens 引入了社会化标签的特性,开始进行基于tag 的推荐尝试。

(5)Diigo :Diigo 是"Digest of Internet Information,Groups and Other stuff "的缩写。该网站除了可以将网页添加作书签、添加标签,用户还可以将网页内容高亮显示、添加说明,还可以将这些书签作为公开、私藏以及与朋友分享;它还具备其他网站没有的网络突出显示功能。(6)Last.fm :Last.fm 是一个以英国为总部的网络电台和音乐社区,有遍布232个国家超过1500万的活跃听众。2007年被CBS Interactive 收购,Last.fm 使用的音乐推荐方式称为“Audioscrobbler”。该系统提供安装在用户的电脑播放程序或随身听设备的插件,记录用户收听的每一首歌的信息,传送回Last.fm 数据库,并以其创建该用户的个人音乐品味,显示在该站提供的用户的个人网页上。该站亦提供多种社交网

络服务,可让用户推荐或收听合其喜好的音乐。

(7)CiteULike:CiteULike是由著名的施普林格出版社(Springer)提供的一个免费协助用户存储、管理和分享学术文章的网站。

对研究人员来说,相关实验数据集的获得非常重要,为了避免大家都要用开发程序去网站爬取实验数据,表一列举了上述典型社会化标签系统的实验数据集获取方式[71],以供大家参考。

表1社会化标签系统相关数据集

数据集包含的系统名称提供数据集的研究小组数据获得年

取得方式Email或链接地址

Delicious Distributed Artificial

Intelligence Laboratory

2007-2008Email请求corpora@dai-labor.de

Bibsonomy KDE(德国卡塞尔大学知

识和数据工程组)每半年进行

一次快照

网页http://www.kde.cs.uni-kassel.de/

bisonomy/dumps

CiteULike Oversity Ltd每天做快照Email support09@https://www.sodocs.net/doc/7e4056544.html, Movielens GroupLens2009网页https://www.sodocs.net/doc/7e4056544.html,/node/73

Delicious,Flickr, Last.fm等TAGora2006,2007,2

008

网页http://www.tagora-project.eu/data/

Delicious, Flickr,Diigo, Bibsonomy等Agents and

Social

Computation

2009Email markus.strohmaier@tugraz.at

6总结语

在海量个性化需求的驱动下,随着个性化服务、人工智能、决策科学、信息检索等领域发展的推动,基于标签的推荐系统研究已取得一定进展,但仍然是一个充满问题与挑战的新兴研究领域,可以深入并可能取得成果的方向有很多,主要包括:

(1)多准则推荐。标签对用户偏好的表达相较于具体的评分值,携带有更多的信息量,有助于反映出用户对产品偏好具体在于那些方面,这一点比较适合于应用到多准则推荐系统[72-74]中去。

(2)标签的预处理问题。社会化标签本身存在着的标注随意性、使用率低以及同义词、多义词等噪声问题,一直制约着推荐算法的性能发挥,所以有必要在目前的自然语言处理[75]、数据挖掘方法(如聚类[76,77])等基础之上继续深入研究。

(3)超图模型较三部图更能够完整表达社会化标签系统各成分之间的关系[78,79],期待在超图模型基础之上有更佳性能的推荐算法产生。

(4)精确化融合标签的用户偏好提取技术。第3节分析讨论了四种基于标签的用户兴趣偏好模型,但这些模型并没有跟原有的用户评分兴趣模型相融合,所以,有必要研究融合多源数据的用户偏好模型。

参考文献

[1]刘建国,周涛,汪秉宏.个性化推荐系统的研究进展[J].自然科学进展,2009,19(1):1-15.

[2]Marshall M.Aggregate Knowledge raises$5M from Kleiner,on a roll.

https://www.sodocs.net/doc/7e4056544.html,/2006/12/10/aggregate-knowledge-raises-5m-from-kleiner-on-a-roll/

[3]Netflix2006annual report.https://www.sodocs.net/doc/7e4056544.html,/annuals.cfm.

[4]Balabanovic M,Shoham Y.FAB:Content-based collaborative recommendation[J].Communications of the ACM,

1997,40(3):66-72.

[5]Kim W,Semantic Kerschberg L,Scime A.Learning for Automatic Personalization in a Semantic Based meta-search

agent[J].Electronic Commerce Research and Applications,2002,1(2):150-173.

[5-1]Rosenstein M,Lochbaum C.Recommending from Content:Preliminary Results from an E-Commerce Experiment[C].

Proceedings of CHI'00:Conference on Human Factors in Computing,The Hague,Netherlands,2000.

[6]Breese,J S,Heckerman D,Kadie C.Empirical Analysis of Predictive Algorithms for Collaborative Filtering[C].

Proceeding of the Fourteenth Conference on Uncertainty in Artificial Intelligence(UAI).Madison,Wisconsin.

Morgan Kaufmann,1998,43-52.

[7]Good N,Schafer J.B.,Konstan J.A.,et https://www.sodocs.net/doc/7e4056544.html,bining Collaborative Filtering With Personal Agents For Better

Recommendations[C].Proceedings of the Sixteenth National Conference on Artificial Intelligence.Orlando, Florida.AAAI Press,1999,439-446.

[8]Herlocker J,Konstan J,Terveen L,et al.Evaluating collaborative filtering recommender systems[J].ACM

Transactions on Information Systems,2004,22(1):5–53.

[9]Schafer J,Frankowski D,Herlocker J,et al.Collaborative Filtering Recommender Systems[C].Lecture Notes

In Computer Science,2007,Vol.4321:291-324.

[10]Zhou T,Ren J,Medo M,Zhang Y C.Bipartite network projection and personal recommendation[J].Phys.Rev.

E,2007,76(4):046115.

[11]Zhou T,Jiang L L,Su R Q,Zhang Y C.Effect of initial configuration on network-based recommendation[J].

Europhys Lett81:58004,2008.

[12]Huang Z,Chen H,Zeng D.Applying associative retrieval techniques to alleviate the sparsity problem in

collaborative filtering[J],IEEE Trans Information Systems,2004,22(1):116-142.

[13]Huang Z,Zeng D,Chen H.Analyzing consumer product graphs:Empirical findings and applications in

recommender systems[J].Management Science,2007,53(7):1146-1164.

[14]Billsus D,Pazzani M J.Learning collaborative information filters[C].Proceedings of AAAI Workshop on

Recommender Systems,1998.

[15]Sarwar B M,Karypis G,Konstan J A,et al.Application of dimensionality reduction in recommender systems

A case study[C].Proceedings of ACM WebKDD Workshop2000.

[16]Sarwar B M,Konstan J A,Borchers A,et https://www.sodocs.net/doc/7e4056544.html,ing filtering agents to improve prediction quality in the

grouplens research collaborative filtering system[C].Proceedings of the1998ACM Conference on Computer Supported Cooperative Work,New York,NY,USA,1998,345–354.

[17]Kantor P B,Ricci F,Rokach L,Shapira B.Recommender Systems Handbook.Springer,2010.

[18]翟爽,宋文.社会标签进展研究概述.图书情报工作[J].2010,54(20):41-44.

[19]Marlow C,Naaman M,Boyd D,et al.Ht06,tagging paper,taxonomy,flickr,academic article,to read[C].

Proceedings of HYPERTEXT’06,New York,USA,ACM Press,2006,31=40.

[20]Scott A.Golder,Bernardo A.Huberman.The structure of collaborative tagging systems,Aug2005

[21]靳延安.社会标签推荐技术与方法研究.博士学位论文.2010.

[22]Bischoff,K.,Firan,C.S.,Nejdl,W.,Paiu,R.,Can All Tags be Used for Search?In Proc.of CIKM’08,

2008,193-202.

[23]Sen,S.,Lam,S.K.,Rashid,A.M.,Cosley,D.,Frankowski,D.,Osterhouse,J.,Harper,M.F.,and Riedl,

J.(2006).Tagging,communities,vocabulary,evolution.In Proceedings of the20th Conference on Computer Supported Cooperative Work,pages181{190,New York,NY,USA.ACM Press.

[24]Halpin,H.,Robu,V.,and Shepherd,H.(2007).The complex dynamics of collaborative tagging.In Proceedings

of the16th International Conference on World Wide Web,pages211{220,New York,NY,USA.ACM Press. [25]Cattuto,C.,Loreto,V.,and Pietronero,L.(2007).Collaborative tagging and semiotic dynamics.PNAS,

104(5):1461{1464.

[26] E.Michlmayr,S.Cayzer,and P.Shabajee.Add-A-Tag:Learning adaptive user profiles from bookmark

collections.In Proceedings of the1st International Conference on Weblogs and Social Media(ICWSM’06), Boulder,Colorado,USA,2007.

[27]Noll MG,Meinel C(2007)Web search personalization via social bookmarking and tagging.In:Proceedings

of6th international semantic web conference(ISWC)and2nd Asian semantic web conference(ASWC),vol4825

of LNCS.Busan,pp367–380

[28]S.Wasserman and K.Faust.Social Network Analysis.Cambridge University Press,Cambridge,1994.

[29]Michlmayr E,Cayzer S(2007)Learning user profiles from tagging data and leveraging them for personal(ized)

information access.In:Proceedings of the workshop on tagging andmetadata for social information organization.

[30]C.M.A.Yeung,N.Gibbins,and N.Shadbolt.A study of user profile generation from folksonomies.In

Social Web and Knowledge Management,Social Web2008Workshop at WWW2008,Beijing,China,2008.

[31]M.Dorigo and G.D.Caro.New Ideas in Optimization,chapter The Ant Colony Optimization Meta-Heuristic,

pages11–32.McGraw-Hill,1999.

[32]GODOY D,AMANDI A.Hybrid content and tag-based profiles for recommendation in collaborative tagging

systems[C],In Proceedings of Latin AmericanWeb Conference.Washington,DC:IEEE Computer Society,2008:58-65.

[33]Heymann,P.and Garcia-Molina,H.(2006).Collaborative creation of communal hierarchical taxonomies in

social tagging systems.Technical Report2006-10,Stanford University.

[34]K.Shen and L.Wu.Folksonomy as a complex network.https://www.sodocs.net/doc/7e4056544.html,/abs/cs.IR/0509072,Sep2005.

[35]Capocci,A.and Caldarelli,G.(2008).Folksonomies and clustering in the collaborative system citeulike.

Journal of Physics A:Mathematical and Theoretical,41(22):224016-224023.

[36]Y.-C.Huang, C.-C.Hung,and J.Y.jen Hsu.You are what you tag.In AAAI Spring Symposium on Social

Information Processing(AAAI-SIP),pages36–41,California,USA,2008.

[37]J.Robert,M.Leandro,H.Andreas,https://www.sodocs.net/doc/7e4056544.html,rs,S.Gerd,Tag recommendations in social bookmarking systems.

AI Communications,2008.21(4):p.231-247.

[38]G.Mishne,AutoTag:a collaborative approach to automated tag assignment for weblog posts,In Proc.of

WWW,2006.

[39]D.Zeng and H.Li,How useful are tags?—an empirical analysis of collaborative tagging for web page

recommendation,in Proceedings of the IEEE ISI2008PAISI,PACCF,and SOCO international workshops on Intelligence and Security Informatics,Springer-Verlag,Taipei,Taiwan,2008,pp.320-330.

[40]Zhao,S.,Du,N.,Nauerz,A.,Zhang,X.,Yuan,Q.,and Fu,R.Improved Recommendation based on Collaborative

Tagging Behaviors.in:Proceedings of the13th international conference on Intelligent user interfaces, ACM,Gran Canaria,Spain,2008,pp.413-416.

[41]Givon,S.,and Lavrenko,V."Predicting Social-tags for Cold Start Book Recommendations,"in:Proceedings

of the third ACM conference on Recommender systems,ACM,New York,New York,USA,2009,pp.333-336. [42]Parra, D.,and Brusilovsky,P."Collaborative Filtering for Social Tagging Systems:An Experiment with

CiteULike,"in:Proceedings of the third ACM conference on Recommender systems,ACM,New York,New York, USA,2009,pp.237-240.

[43]Sen,S.,Vig,J.,and Riedl,J."Tagommenders:Connecting Users to Items through Tags,"in:Proceedings

of the18th international conference on World Wide Web,ACM,Madrid,Spain,2009,pp.671-680.

[44]Markines,B.,Cattuto,C.,Menczer,F.,Benz,D.,Hotho,A.,and Stumme,G."Evaluating similarity measures

for emergent semantics of social tagging,"in:Proceedings of the18th international conference on World Wide Web,ACM,Madrid,Spain,2009,pp.641-650.

[45]J.Wang,A.P.de Vries,and M.J.T.Reinders.Unifying user-based and item-based collaborative filtering

approaches by similarity fusion.In SIGIR’06:Proceedings of the29th annual international ACM SIGIR conference on Research and development in information retrieval,pages501–508,New York,NY,USA,2006.

ACM Press.

[46]Tso-Sutter,K.H.L.,Marinho,L.B.and Schmidt-Thieme,L.,Tag-aware Recommender Systems by Fusion of

Collaborative Filtering Algorithms.In Proc.of Applied Computing,2008,1995-1999.

[47]Hotho A,J?schkes R,Schmitz C,Stumme https://www.sodocs.net/doc/7e4056544.html,rmation retrieval in folksonomies:search and ranking.In:

Sure Y,Domingue J(eds)The Semantic web:research and applications,vol4011of LNAI.Springer,Heidelberg, pp411–426

[48]Hotho A,J?schke R,Schmitz C,Stumme G.FolkRank:a ranking algorithm for folksonomies.In Proceedings

of workshop on information retrieval(FGIR).Germany,2006.

[49]Zhang Z K,Zhou T,Zhang Y C.Personalized recommendation via integrated diffusion on user-item-tag

tripartite graphs.Physica A,2010,389(1):179-186.

[50]Brin S,Page L(1998)The anatomy of a large-scale hypertextual web search https://www.sodocs.net/doc/7e4056544.html,put Networks ISDN

Syst30(1–7):107–117.

[51]Zhang YC,Medo M,Ren J,et al.Recommendation model based on opinion diffusion.Europhys Lett-2007,80:68003

[52]Zhang Y C,Blattner M,Yu Y K.Heat conduction process on community networks as a recommendation mode.Phys.

Rev.Lett.,2007,99(15):154301.

[53]Zhou T,Kuscsik Z,Liu J G et al.Solving the apparent diversity-accuracy dilemma of recommender systems.

Proc.Natl.Acad.Sci.U.S.A.,2010,107(10):4511-4515.

[54]N.Tintarev and J.Masthoff.A survey of explanations in recommender systems.In IEEE23rd International

Conference on Data Engineering Workshop,pages801–810,2007.

[55]Zhang Z K,Liu C,Zhang Y C,Zhou T.Solving the cold-start problem in recommender systems with social

tags.EPL,2010,92(2):28002.

[56]Hofmann T.Probabilistic latent semantic indexing.In Proc.Of the22nd Annual ACM Conference on Research

and Development Information Retrieval,Berkeley,California,USA,1999,pp.50-57.

[57]Wetzker R,Umbrath W,Said A(2009)A hybrid approach to item recommendation in folksonomies ESAIR‘09:

proceedings of theWSDM‘09workshop on exploiting semantic annotations in information retrieval.ACM,New York,pp25–29.

[58]David A.Cohn and Thomas Hofmann.The missing link-a probabilistic model of document content and hypertext

connectivity.in NIPS,eds.,Todd K.Leen,Thomas G.Dietterich,and Volker Tresp,pp.430–436.MIT Press, (2000).

[59]Arenas-García J,Meng A,Petersen KB,Schi?ler T L,Hansen LK,Larsen J(2007)Unveiling music structure

via PLSA similarity fusion.In:IEEE international workshop on machine learning for signal processing.IEEE Press,pp419–424.

[60]S.Rendle and L.Schmidt-Thieme.Pairwise interaction tensor factorization for personalized tag

recommendation.In Proceedings of the third ACM international conference on Web search and data mining, pages81–90.ACM,2010.

[61]Datta,B.Numerical Linear Algebra and Application.Brooks/Cole Publishing Company,1995.

[62]Steffen Rendle,Leandro B.Marinho,Alexandros Nanopoulos,and Lars S.Thieme.Learning optimal ranking

with tensor factorization for tag recommendation.In KDD’09:Proceedings of the15th ACM SIGKDD international conference on Knowledge discovery and data mining,pages727–736.ACM,2009.

[63]Panagiotis Symeonidis,Alexandros Nanopoulos,and Yannis Manolopoulos.Tag recommendations based on tensor

dimensionality reduction.In RecSys’08:Proceedings of the2008ACM conference on Recommender systems, pages43–50,New York,NY,USA,2008.ACM.

[64]Yanfei Xu,Liang Zhang,and Wei Liu.Cubic analysis of social bookmarking for personalized recommendation.

pages733–738.2006.

[65]S.Rendle and L.Schmidt-Thieme.Pairwise interaction tensor factorization for personalized tag

recommendation.In Proceedings of the third ACM international conference on Web search and data mining, pages81–90.ACM,2010.

[66]Martin Leginus and Valdas?emaitis.Analysis of the recommendation systems based on the tensor factorization

techniques,experiments and the proposals.Aalborg University.Project Report(2011)

[67]L.R.Tucker.Some mathematical notes on three-mode factor analysis.Psychometrika,31(3):279–311,1966.

[68]Tamara G.Kolda and BrettW.Bader.Tensor decompositions and applications.SIAM Review,51(3):455–500,

September2009.

[69]https://www.sodocs.net/doc/7e4056544.html,thauwer,B.d.Moor,and J.Vandewalle.A multilinear singular value decomposition.SIAM Journal

of Matrix Analysis and Applications,21(4):1253–1278,2000.

[70]Panagiotis Symeonidis,Alexandros Nanopoulos,and Yannis Manolopoulos.A unified framework for providing

recommendations in social tagging systems based on ternary semantic analysis.IEEE Trans.on Knowl.and Data Eng.,22:179–192,February2010.

[71] C.K orner and M.Strohmaier.A call for social tagging datasets.ACM SIGWEB Newsletter,2010.

[72]N.Manouselis and C.Costopoulou.Analysis and classification of multi-criteria recommender systems.World

Wide Web:Internet and Web Information Systems,10(4):415–441,2007.

[73]Zhang,Y.,Zhuang,Y.,Wu,J.and Zhang,L.2009.Applying probabilistic latent semantic analysis to

multi-criteria recommender system.AI Communications.22,2,97–107.

[74]Lakiotaki,K.,Matsatsinis,N.F.,and Tsoukiàs,A.2011.Multicriteria User Modeling in Recommender Systems.

In Proceedings of IEEE Intelligent Systems.2011,64-76.

[75]M.Guy and E.Tonkin.Tidying up Tags?D-Lib Magazine,12(1):1082–9873,2006.

[76]Gemmell,J.and Shepitsen,A.and Mobasher,M.and Burke,R.:Personalization in Folksonomies Based on

Tag Clustering.In:6th Workshop on Intelligent Techniques for Web Personalization and Recommender Systems, pp.259–266.ACM,Chicago,Illinois,USA(2008)

[77]J.Gemmell, A.Shepitsen, B.Mobasher,and R.Burke.Personalizing navigation in folksonomies using

hierarchical tag clustering.In Proceedings of DaWak'08,pages196-205.Springer-Verlag,2008.

[78]Zlati?V,Ghoshal G,Caldarelli G.Hypergraph topological quantities for tagged social networks.Phys.

Rev.E,2009,80(3):036118.

[79]Zhang Z K,Liu C.A hypergraph model of social tagging networks.J.Stat.Mech.,2010,(10):P10005.

个性化推荐系统分析与设计

课程设计报告 课程名称系统分析设计与开发方法 课题名称个性化推荐系统的分析与设计 专业信息管理与信息系统 班级1002 学号201003110215 姓名黄天玲 指导教师唐志航 2014年元月4 日

一、设计内容与设计要求 1.设计内容: 见附录 2.设计要求: 1).设计正确,方案合理。 2).界面友好,使用方便。 3).建模语言精炼,结构清晰。 4).设计报告4000字以上,含建模语言说明,用户使用说明,UML建模图。 5).上机演示。 二、进度安排 第十七周星期四下午:课题讲解,查阅资料、系统分析 星期五上午:总体设计、详细设计 第十八周星期一:建模,上机调试、撰写课程设计报告 星期二下午:答辩 附: 课程设计报告装订顺序:封面、任务书、目录、正文、评分、附件(A4大小的图纸及程序清单)。 正文的格式:一级标题用3号黑体,二级标题用四号宋体加粗,正文用小四号宋体;行距为22。

设计课题:个性化推荐系统的分析与设计 一、问题描述: 对网络购物个性化推荐系统进行分析与设计,对购物流程进行分析,对购物中关键环节进行设计,实现对商品的录入、显示、修改、排序、保存、销售、售后服务以及客户管理等操作实现推荐结果准确性、推荐结果多样性、用户交互度、系统界面设计、系统交互设计、推荐透明度(推荐解释)。 二、功能要求: 1、用UML完成一个小型团购系统的分析、设计。 2、写出系统需求报告,说明系统的功能。 3、通过面向对象的分析和设计建立系统模型。 4、画出完整的用例图、类图、对象图、包图;及时序图、协作图、状态图、活动图;及组件图和配置图) 三、建模提示: 1、使用Enterprise Architect 8.0建模。 2、使用 Ration Rose 或StarUML建模。 四、其它 对该系统有兴趣的同学可以在实现上述基本功能后,完善系统的其它功能,特别是售后以及客户关系管理。

个性化音乐推荐系统设计与实现

个性化音乐推荐系统设计与实现 摘要 21世纪是信息化时代,随着信息技术和网络技术的发展,信息化已经渗透到人们日常生活的各个方面,与人们的日常生活早已建立了离不开的联系。对网络音乐服务来说,不管是音乐下载服务,或者是网络音乐电台服务,都需要用到优秀的内容推荐系统去辅助整个系统。个性化音乐推荐系统是目前最流行的应用方法之一。同时音乐成为重要的媒介与朋友交流文化,所以很多SNS应用当中将音乐服务添加到里面。 本系统采用SSH框架组合进行设计,基于Java Web技术,系统使用UML建模。本系统的功能模块主要包括:音乐上传、单曲管理、个人信息维护、收集歌曲信息、音乐检索以及系统推荐等。音乐上传利用JavaScript脚本定义了一个函数,单曲管理在action中定义一个方法,系统推荐是利用协同过滤算法来进行的。 整个系统主要实现了从用户注册和登录、检索音乐到收听音乐、评分音乐,个性化推荐的整个音乐系统,管理员可使用系统后台对音乐歌曲信息进行修改、会员信息修改、系统推荐等进行有效的管理。很大程度上提高了对音乐管理的效率,符合了广大用户们的基本需求。 关键词:SSH框架,音乐系统,协同过滤,MVC模式

DESIGN AND INPLEMENTATION OF PERSONALIZED MUSIC RECOMMENDATION SYSTEM Abstract The 21st century is the era of information, with the development of information technology and network technology, it has penetrated into every aspect of daily life, with people in daily life has been inextricably linked to the the Internet music service, whether it is music download service, or network music radio service, all need to use the excellent content recommendation system to support the whole system. Personalized music recommendation system is one of the most popular applications. At the same time music has become an important medium of communication with friends culture, so many SNS applications when the music services added to the inside. The system uses a combination of SSH framework design, based on Java Web technology,system used UML modeling. Site function modules include: Music upload, music management,personal information maintenance, collecting music information, music search and system recommend. The entire site is simple, user-friendly, flexible and practical. The main achievement of the user registration and login, retrieve music to listen to music, the whole comment is called online music listening processes, and system administrators can use the background information on the goods, membership information, message information, and effective management. Greatly improving the efficiency of music management, in line with the needs of customers. Keywords: SSH Framework,Music System,Collaborative Filtering,MVC Pattern

推荐系统调研报告及综述

推荐系统调研报告及综述 张永锋 清华大学计算机系人工智能研究所 zhangyf07@https://www.sodocs.net/doc/7e4056544.html, 一、推荐系统概述 1.1 什么是推荐系统 推荐系统(Recommender System)的发展已经经历了近20年的时间,但是迄今为止仍没有人试图对推荐系统给出一个精确的定义。 广义上的推荐系统可以理解为是主动向用户推荐物品(Item)的系统,所推荐的物品可以是音乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,这依赖于具体的应用领域,推荐系统所推荐的物品或者对用户有帮助,或者用户可能感兴趣[1]。 随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(Personalized Recommender System)应运而生[1]。目前所说的推荐系统一般指个性化推荐系统。 1.2 推荐系统的发展历史 如果追根溯源,推荐系统的初端可以追溯到函数逼近理论、信息检索、预测理论等诸多学科中的一些延伸研究。 推荐系统成为一个相对独立的研究方向一般被认为始自1994年明尼苏达大学GroupLens研究组推出的GroupLens系统[2]。该系统有两大重要贡献:一是首次提出了基于协同过滤(Collaborative Filtering)来完成推荐任务的思想,二是为推荐问题建立了一个形式化的模型(见1.4)。基于该模型的协同过滤推荐引领了之后推荐系统在今后十几年的发展方向。 GroupLens所提出的推荐算法实际上就是目前人们时常提及的基于用户的协同过滤推荐算法(User-based Collaborative Filtering Algorithms),虽然论文本身并没有使用这样一个名字。在之后的十几年中,其它一些著名的协同过滤算法逐渐被提出,主要的有基于物品的协同过滤算法(Item-based Collaborative Filtering Algorithms)[3],基于矩阵分解的协同过滤算法(SVD-based/NMF-based, etc.)等等。当然,基于其它方法而非协同过滤的推荐算法也在不断地发展,这些方法之间的互补、融合也成为一个重要的研究方向,这些会在本文第二部分(推荐方法的分类)和第三部分(典型推荐算法概述及优缺点)中详细阐述。 目前,推荐算法已经已经被广泛集成到了很多商业应用系统中,比较著名的有Netflix在线视频推荐系统、Amazon网络购物商城等。实际上,大多数的电子商务平台尤其是网络购物平台,都不同程度地集成了推荐算法,如淘宝、京东商城等。Amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。

个性化推荐系统研究综述

个性化推荐系统研究综述 【摘要】个性化推荐系统不仅在社会经济中具有重要的应用价值,而且也是一个非常值得研究的科学问题。给出个性化推荐系统的定义,国内外研究现状,同时阐述了推荐系统的推荐算法。最后对个性化推系统做出总结与展望。 【关键词】推荐系统;推荐算法;个性化 1.个性化推荐系统 1.1个性化推荐系统的概论 推荐系统是一种特殊形式的信息过滤系统(Information Filtering),推荐系统通过分析用户的历史兴趣和偏好信息,可以在项目空间中确定用户现在和将来可能会喜欢的项目,进而主动向用户提供相应的项目推荐服务[1]。传统推荐系统认为推荐系统通过获得用户个人兴趣,根据推荐算法,并对用户进行产品推荐。事实上,推荐系统不仅局限于单向的信息传递,还可以同时实现面向终端客户和面向企业的双向信息传递。 一个完整的推荐系统由3个部分组成:收集用户信息的行为记录模块,分析用户喜好的模型分析模块和推荐算法模块,其中推荐算法模块是推荐系统中最为核心的部分。推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。 1.2国内外研究现状 推荐系统的研宄开始于上世纪90年代初期,推荐系统大量借鉴了相关领域的研宄成果,在推荐系统的研宄中广泛应用了认知科学、近似理论、信息检索、预测理论、管理科学以及市场建模等多个领域的知识。随着互联网的普及和电子商务的发展,推荐系统逐渐成为电子商务IT技术的一个重要研究内容,得到了越来越多研究者的关注。ACM从1999年开始每年召开一次电子商务的研讨会,其中关于电子商务推荐系统的研究文章占据了很大比重。个性化推荐研究直到20世纪90年代才被作为一个独立的概念提出来。最近的迅猛发展,来源于Web210技术的成熟。有了这个技术,用户不再是被动的网页浏览者,而是成为主动参与者[2]。 个性化推荐系统的研究内容和研究方向主要包括:(1)推荐系统的推荐精度和实时性是一对矛盾的研究;(2)推荐质量研究,例如在客户评价数据的极端稀疏性使得推荐系统无法产生有效的推荐,推荐系统的推荐质量难以保证;(3)多种数据多种技术集成性研究;(4)数据挖掘技术在个性化推荐系统中的应用问题,基于Web挖掘的推荐系统得到了越来越多研究者的关注;(5)由于推荐系统需要分析用户购买习惯和兴趣爱好,涉及到用户隐私问题,如何在提供推荐服务的

个性化推荐系统的文献综述

个性化推荐系统在电子商务网站中的应用研究 一、引言 随着Internet的普及,信息爆炸时代接踵而至,海量的信息同时呈现,使用户难以从中发现自己感兴趣的部分,甚至也使得大量几乎无人问津的信息称为网络总的“暗信息”无法被一般用户获取。同样,随着电子商务迅猛发展,网站在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。 个性化推荐,被认为是当前解决信息超载问题最有效的工具之一.推荐问题从根本上说就是从用户的角度出发,代替用户去评估其从未看过的产品,使用户不只是被动的网页浏览者,而成为主动参与者。准确、高效的推荐系统可以挖掘用户的偏好和需求,从而成为发现用户潜在的消费倾向,为其提供个性化服务。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手断,更重要的是可以增进用户的黏着性。本文对文献的综述包括个性化推荐系统的概述、常用的个性化推荐系统算法分析以及个性化推荐系统能够为电子商务网站带来的价值。 二、个性化推荐系统概述 个性化推荐系统是指根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于:网站最热卖商品、客户所处城市、客户过去的购买行为和购买记录,推测客户将来可能的购买行为。 1995年3月,卡内基 梅隆大学的Robert Armstrong等人在美国人工智能协会首次提出了个性化导航系统Web-Watcher,斯坦福大学的Marko Balabanovic 等人在同一次会议上推出了个性化推荐系统LIRA。同年8月,麻省理工学院的

新闻个性化推荐系统

新闻个性化推荐系统(python) 关zhu并回复微信公众号:数据挖掘DW (ID:datadw )可获取源代码和数据集。 最近参加了一个评测,是关于新闻个性化推荐。说白了就是给你一个人的浏览记录,预测他下一次的浏览记录。花了一周时间写了一个集成系统,可以一键推荐新闻,但是准确率比较不理想,所以发到这里希望大家给与一些建议。用到的分词部分的代码借用的jieba分词。数据集和代码在下面会给出。 1.数据集 一共五个字段,以tab隔开。分别是user编号,news编号,时间编号,新闻标题,对应当前月份的日(3就是3号) 2.代码部分

先来看下演示图 (1)算法说明 举个例子简单说明下算法,其实也比较简单,不妥的地方希望大家指正。我们有如下一条数据 [plain]view plaincopy 1.5738936 100649879 1394550848 MH370航班假护照乘客身份查明(更新) 11 5738936这名用户在11号看了“MH370航班假护照乘客...”这条新闻。我们通过jieba找出11号的热点词如下。

[plain]view plaincopy 1.失联 311 三周年马方偷渡客隐形护照吉隆坡航班护照者 我们发现“航班”、“护照”这两个keywords出现在新闻里。于是我们就推荐5738936这名用户,11号出现“航班”、“护照”的其它新闻。同时我们对推荐集做了处理,比如说5738936浏览过的新闻不会出现,热度非常低的新闻不会出现等。 (2)使用方法 整个系统采用一键式启动,使用起来非常方便。首先建立一个test 文件夹,然后在test里新建三个文件夹,注意命名要和图中的统一,因为新闻是有时效的,每一天要去分开来计算,要存储每一天的内容做成文档。test文档如下图,就可以自动生成。 使用的时候,要先在Global_param.py中设置好test文件夹的路径参数。一切设置完毕,只要找到wordSplite_test包下面的main()函数,运行程序即可。

个性化推荐算法概述与展望

Hans Journal of Data Mining 数据挖掘, 2019, 9(3), 81-87 Published Online July 2019 in Hans. https://www.sodocs.net/doc/7e4056544.html,/journal/hjdm https://https://www.sodocs.net/doc/7e4056544.html,/10.12677/hjdm.2019.93010 Overview and Prospect of Personalized Recommendation Algorithm Xinxin Li Dalian University of Foreign Languages, Dalian Liaoning Received: Jun. 19th, 2019; accepted: Jul. 2nd, 2019; published: Jul. 9th, 2019 Abstract In recent years, the word “information overload” frequently appears in people’s vision, it has be-come a hot word in the field of computer, and it is also an important problem that researchers ur-gently need to solve. In order to solve the problem of information overload, researchers in the field of computer constantly optimize the personalized recommendation algorithm, strive to re-duce the difficulty of information retrieval for users, to provide users with the best personalized recommendation results. This paper gives a brief overview of the personalized recommendation methods which are widely used and common. Combined with the experience of using personalized recommendation algorithm to generate results in daily life, the author puts forward expectations for the development of personalized recommendation algorithm in the future. Keywords Personalized Recommendation, Collaborative Filtering, Hybrid Recommendation 个性化推荐算法概述与展望 李鑫欣 大连外国语大学,辽宁大连 收稿日期:2019年6月19日;录用日期:2019年7月2日;发布日期:2019年7月9日 摘要 近年来,“信息过载”一词频繁出现在人们的视野中,它成为了计算机相关领域中的热门词汇,同时它也是研究人员急待解决的重要问题。为解决信息超载的问题,计算机领域研究人员不断优化个性化推荐

个性化推荐知识汇总

一 基于协同过滤(collaborative filtering,CF)的推荐系统通过收集来自其他相似用户或项目的评价信息,自动预测当前用户的兴趣偏好。协同过滤的基本假设是用户会更喜欢那些相似用户偏爱的商品,已被广泛应用在一些大型的商业系统,如亚马逊和阿里巴巴等。 目前,协同过滤算法主要包括基于内存的、基于模型的以及二者相混合的推荐技术”。使用最多的模型是k最近邻(k-nearest neighbor,kNN)协同过滤技术,包括基于用户推荐和基于项目推荐两种技术。 一般说来,本体描述了某个应用领域的概念和概念之间的关系,使得它们具有唯一确定的含义,获得该领域的相关知识,提供对该领域知识的共同理解,便于用户和计算机之间进行交流。 OntoECRec推荐模型 二 1995年,卡内基·梅隆大学的A.RDben等人在美国人工智能协会上提出了个性化导航系统we-watcher,真正标志着个性化服务的开始;1997年3月,(communications of the AcM)。组织了个性化推荐系统的专题报道,标志着个性化服务已经被技术界高度重视;1999年,德国Dresden技术大学的J.Tania 实现了个性化电子商务原型系统TELLIM,标志着个性化服务开始向全球发展;2000年,NEc研究院的D.B.Kurt等人为搜索引擎atesecr增加了个性化推荐功能,实现citeseer的个性化。2001年,纽约大学的GediminaS Adomavicius 和Alexander Tuzhilin实现了个性化电子商务网站的用户建模系统1:1Pro。 个性化推荐服务体系结构中,信息收集模块是个性化服务系统的基础模块。用户的信息包括了用户的个人基本资料、购买的历史记录及浏览记录等。个人基本资料可以从用户注册表单中获得;购买的历史记录主要存放于电子商务网站的后台交易数据库中,包含了每位用户以前历次购物的详细情况记录,如购物时间、商品清单、价格、折扣等,同时也可以收集用户放入购物篮而未购买的商品记录,以及用户过去浏览过的商品信息等。当然要搜集用户的行为信息,日志文件是必不可少的,如要收集服务器日志,则要在服务器端获取,抽取出特定用户的访问记录;如要收集用户浏览的页面和浏览行为,则既可以在用户端获得,也可以在服务器端从用户记录中获得。

个性化推荐系统

个性化推荐系统软件说明书 一.软件背景 随着近年来互联网的飞速发展,个性化推荐已成为各大主流网站的一项必不可少服务。提供各类新闻的门户网站是互联网上的传统服务,但是与当今蓬勃发展的电子商务网站相比,新闻的个性化推荐服务水平仍存在较大差距。一个互联网用户可能不会在线购物,但是绝大部分的互联网用户都会在线阅读新闻。因此资讯类网站的用户覆盖面更广,如果能够更好的挖掘用户的潜在兴趣并进行相应的新闻推荐,就能够产生更大的社会和经济价值。 初步研究发现,同一个用户浏览的不同新闻的内容之间会存在一定的相似性和关联,物理世界完全不相关的用户也有可能拥有类似的新闻浏览兴趣。此外,用户浏览新闻的兴趣也会随着时间变化,这给推荐系统带来了新的机会和挑战。因此,希望通过对带有时间标记的用户浏览行为和新闻文本内容进行分析,挖掘用户的新闻浏览模式和变化规律,设计及时准确的推荐系统预测用户未来可能感兴趣的新闻。 本软件就是用来实现根据用户数据,分析用户行为,为用户进行个性化推荐等功能. 二.软件环境 运行环境Windows XP/7/8 编译环境VS2010 三.运行参数 News_list:新闻列表 News_times:x新闻阅读次数 Step_correlation:一步转移数据 User_list:用户列表 Train_data:原始数据 附加数据:用户适应度 四.算法说明

人们常把事物的随机变化过程称作马尔可夫过程。它具有无后效性,即事物的将来呈什么状态、取什么值,仅与它现在的状态和取值有关,与它以前的状态和取值无关。马尔可夫链则是事物在连续一段时期内若干马尔可夫过程的总称,表明事物状态由过去到现在、由现在到将来,一环接一环,像一根链条。在预测领域,人们用其对预测对象各个状态的初始分布和各状态间的转移概率进行研究,描述状态的变化趋势,并由此来预测未来。由于新闻网页推荐方式的不同,可能导致链长不同的马尔科夫链的产生。其他不定因素诸如用户的浏览习惯也可能导致不同链长的马尔科夫链。 本软件使用了该思想,利用用户最后的阅读记录来进行推测。由于许多用户的新闻阅读数目有限,直接限制了链长的长度,所以我们从三阶马尔科夫链开始,作为尝试,但尝试后发现效果并没有提升,反而会出现因为条件过于苛刻而无法推荐的情况。 最终我们采取了一步马链的形式来作为推荐算法,流程图如下: 算法流程图

基于内容的新闻推荐系统方案

基于内容的新闻推荐系统 一般在一个个性化推荐系统中,用户对已经看过的对象依据感兴趣程度进行评分,推荐系统根据用户对已查看对象的评分情况,预测用户对未查看对象的评分,并将用户未查看对象按照预测评分的高低排序,呈现给用户。 抽象地看,推荐系统是预测用户对未查看对象评分的系统。而推荐系统对未查看对象的评分方法即为推荐算法。而主要的推荐算法有三类:①、协同过滤的推荐方法、②、基于内容的推荐方法、③、混

合的推荐方法。 ①、协同过滤是利用集体智慧的一个典型方法。 协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。 比如说,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电影推荐,而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。 协同过滤相对于集体智慧而言,它从一定程度上保留了个体的特征,就是你的品位偏好,所以它更多可以作为个性化推荐的算法思想。 二、协同过滤的实现步骤: 1)、收集用户偏好 而要从用户的行为和偏好中发现规律,并基于此给予推荐,如何收集用户的偏好信息成为系统推荐效果最基础的决定因素。用户有很多方式向系统提供自己的偏好信息,而且 2)、找到相似的用户或物品 当已经对用户行为进行分析得到用户喜好后,我们可以根据用户喜好计算相似用户和物品,然后基于相似物品进行推荐,这就是最典型的CF 的分支之一——基于物品的CF。 3)、计算推荐——基于物品的CF 比如说,对于物品A,根据所有用户的历史偏好,喜欢物品A 的用户都喜欢物品C,

个性化推荐系统中的多样性综述

Software Engineering and Applications 软件工程与应用, 2019, 8(3), 172-178 Published Online June 2019 in Hans. https://www.sodocs.net/doc/7e4056544.html,/journal/sea https://https://www.sodocs.net/doc/7e4056544.html,/10.12677/sea.2019.83021 A Survey of Diversity in Personalized Recommendation Systems Shuhao Jiang1,2, Liyi Zhang1,2, Na Zhou1 1School of Electrical and Information Engineering, Tianjin University, Tianjin 2School of Information Engineering, Tianjin University of Commerce, Tianjin Received: June 6th, 2019; accepted: June 21st, 2019; published: June 28th, 2019 Abstract Diversity has become one of the main directions of recommendation system research. Improving the diversity of recommendation content is not only an important way to solve the problem of over-fitting, but also a way to improve user’s experience satisfaction. In order to elaborate the work in the field of recommendation diversity, this paper introduces diversity recommendation from three aspects: the definition and evaluation of diversity, the impact of diversity on recom-mendation quality and the development of diversity algorithm. Keywords Personalized Recommendation, Diversity, Recommendation Quality, Evaluation 个性化推荐系统中的多样性综述 姜书浩1,2,张立毅1,2,周娜1 1天津大学电气自动化与信息工程学院,天津 2天津商业大学信息工程学院,天津 收稿日期:2019年6月6日;录用日期:2019年6月21日;发布日期:2019年6月28日 摘要 多样性已成为推荐系统研究的主要方向之一,提高推荐内容的多样性不仅是解决过度拟合问题的重要方法,也是提高用户体验满意度的方法。为了更好地阐述推荐多样性领域的工作,本文分别从多样性的定义和评价、多样性对推荐质量的影响以及多样化算法本身的发展三个方面对多样性推荐进行了介绍。

基于内容的新闻推荐系统

基于内容的新闻推荐系统 项目课题基于内容的新闻推荐系统 功能描述网络媒体中,新闻资讯的数量以近乎爆炸的速度增长,使广大网络新闻的读者受到“信息过载”和“信息迷航”问题的困扰。个性化新闻推荐系统 可以通过分析用户使用习惯,识别用户兴趣点,将用户感兴趣的新闻资讯推 荐给用户,过滤他们不感兴趣的内容,而我所作的这个推荐推荐系统就是为 了有效地缓解上述问题。 基于内容的新闻推荐系统:它将计算得到并推荐给用户一些与该用户已选择过的项目相似的内容。例如,当你在网上看新闻时,你总是阅读与IT相关的 文章,那么基于内容的新闻推荐系统就会给你推荐一些热门的IT方面的文章。 方法描述基于内容的推荐(Content-based Recommendation)是建立在项目的内容信息上作出推荐的,而不需要依据用户对项目的评价意见,更多地需要用机器学 习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。 内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。 通过相关特征的属性来定义项目或对象,系统基于用户评价对象的特征学习用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,努力向客户推 荐与其以前喜欢的产品相似的产品。 在基于内容的推荐系统中,项目或对象是通过相关的特征的属性来定义,系统基于用户评价对象的特征,学习用户的兴趣,考察用户资料与待预测项目 的相匹配程度。用户的资料模型取决于所用学习方法,常用的有决策树、神经 网络和基于向量的表示方法等。基于内容的用户资料是需要有用户的历史数据, 用户资料模型可能随着用户的偏好改变而发生变化。 要实现内容推荐系统总体来说要经过4个大的步骤: 1、搜集数据, 2、过滤数据, 3、分析数据,4 输出结果。 技术难点难点1:如何实现新闻正文的过滤下载。 难点2:如何对新闻进行量化,并提取出关键词,最后完成数学建模。 难点3:如何利用基于内容的推荐技术为每个用户建立用户模型。 难点4:如何用编程语言实现这些软件功能,这便是该软件设计过程中最最困 难的一个难题。 一般在一个个性化推荐系统中,用户对已经看过的对象依据感兴趣程度进行评分,推荐系统根据用户对已查看对象的评分情况,预测用户对未查看对象的评分,并将用户未查看对象按照预测评分的高低排序,呈现给用户。 抽象地看,推荐系统是预测用户对未查看对象评分的系统。而推荐系统对未查看对象的评分方法即为推荐算法。而主要的推荐算法有三类:①、协同过滤的推荐方法、②、基于内容的推荐方法、③、混合的推荐方法。

推荐系统调研报告及综述

推荐系统调研报告及综述 一、推荐系统概述 1.1 什么是推荐系统 推荐系统(Recommender System)的发展已经经历了近20年的时间,但是迄今为止仍没有人试图对推荐系统给出一个精确的定义。 广义上的推荐系统可以理解为是主动向用户推荐物品(Item)的系统,所推荐的物品可以是音乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,这依赖于具体的应用领域,推荐系统所推荐的物品或者对用户有帮助,或者用户可能感兴趣[1]。 随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(Personalized Recommender System)应运而生[1]。目前所说的推荐系统一般指个性化推荐系统。 1.2 推荐系统的发展历史 如果追根溯源,推荐系统的初端可以追溯到函数逼近理论、信息检索、预测理论等诸多学科中的一些延伸研究。 推荐系统成为一个相对独立的研究方向一般被认为始自1994年明尼苏达大学GroupLens研究组推出的GroupLens系统[2]。该系统有两大重要贡献:一是首次提出了基于协同过滤(Collaborative Filtering)来完成推荐任务的思想,二是为推荐问题建立了一个形式化的模型(见1.4)。基于该模型的协同过滤推荐引领了之后推荐系统在今后十几年的发展方向。 GroupLens所提出的推荐算法实际上就是目前人们时常提及的基于用户的协同过滤推荐算法(User-based Collaborative Filtering Algorithms),虽然论文本身并没有使用这样一个名字。在之后的十几年中,其它一些著名的协同过滤算法逐渐被提出,主要的有基于物品的协同过滤算法(Item-based Collaborative Filtering Algorithms)[3],基于矩阵分解的协同过滤算法(SVD-based/NMF-based, etc.)等等。当然,基于其它方法而非协同过滤的推荐算法也在不断地发展,这些方法之间的互补、融合也成为一个重要的研究方向,这些会在本文第二部分(推荐方法的分类)和第三部分(典型推荐算法概述及优缺点)中详细阐述。 目前,推荐算法已经已经被广泛集成到了很多商业应用系统中,比较著名的有Netflix在线视频推荐系统、Amazon网络购物商城等。实际上,大多数的电子商务平台尤其是网络购物平台,都不同程度地集成了推荐算法,如淘宝、京东商城等。Amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。

个性化推荐系统的文献综述

个性化推荐系统的文献综述 个性化推荐系统在电子商务网站中的应用研究一、引言随着Internet的普及,信息爆炸时代接踵而至,海量的信息同时呈现,使用户难以从中发现自己感兴趣的部分,甚至也使得大量几乎无人问津的信息称为网络总的“暗信息”无法被一般用户获取。同样,随着电子商务迅猛发展,网站在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。个性化推荐,被认为是当前解决信息超载问题最有效的工具之一.推荐问题从根本上说就是从用户的角度出发,代替用户去评估其从未看过的产品,使用户不只是被动的网页浏览者,而成为主动参与者。准确、高效的推荐系统可以挖掘用户的偏好和需求,从而成为发现用户潜在的消费倾向,

为其提供个性化服务。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手断,更重要的是可以增进用户的黏着性。对文献的综述包括个性化推荐系统的概述、常用的个性化推荐系统算法分析以及个性化推荐系统能够为电子商务网站带来的价值。 二、个性化推荐系统概述个性化推荐系统是指根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于:网站最热卖商品、客户所处城市、客户过去的购买行为和购买记录,推测客户将来可能的购买行为。1995年3月,卡内基?梅隆大学的Robert Armstrong等人在美国人工智能协会首次提出了个性化导航系统

用户浏览新闻的模式分析及个性化新闻推荐

天津财经大学 本科毕业论文 题目:用户浏览新闻的模式分析及个性化新闻推荐系统 院系名称:理工学院 专业班级:计科1101... 学号:2011110709 姓名:康磊... 指导教师:陈钒 年月日

内容摘要 正文要与“内容摘要”四字之间空一行。“关键词”三字为四号黑体,加粗左对齐。关键词最多不能超过5个,字号为四号,字体为楷体。关键词之间要用分号隔开,这部分与摘要内容部分之间空一行。中文的内容摘要与关键词在一页,不标页码。 关键词:写作规范;排版格式;学位论文

目录 摘要................................................................ 错误!未定义书签。目录................................................................ 错误!未定义书签。 一、绪论......................................................... 错误!未定义书签。 (一)研究背景和意义 ............................ 错误!未定义书签。 (二)国内外研究现状 ............................ 错误!未定义书签。 (三)主要研究内容................................ 错误!未定义书签。 (四)本文的组织结构 ............................ 错误!未定义书签。 二、相关技术概述......................................... 错误!未定义书签。 (一)用户模型....................................... 错误!未定义书签。 1.1 用户模型的形式......... 错误!未定义书签。(主题表示法) 1.2 用户模型的建模技术...................... 错误!未定义书签。 (二)个性化推荐技术 ............................ 错误!未定义书签。 2.1 协同过滤推荐技术 ......................... 错误!未定义书签。 2.2 基于内容的推荐技术...................... 错误!未定义书签。 2.3 混合推荐技术 ................................ 错误!未定义书签。 (三)数据挖掘技术................................ 错误!未定义书签。 (四)小结.............................................. 错误!未定义书签。 三、用户浏览行为分析与建模....................... 错误!未定义书签。 (一)基于时间浏览的行为分析................ 错误!未定义书签。 (二)基于标题浏览的行为分析................ 错误!未定义书签。

个性化推荐系统在当当网中的运用分析

目录 一、摘要 二、当当网概述 1)当当网简介 三、个性化推荐系统营销理论综述及原因 1)个性化推荐系统营销概念及分类 a 基于内容的推荐系统 b 协同过滤推荐系统 c 混合推荐系统 2)个性化推荐系统的发展历程 3)当当网使用个性化推荐系统的原因 四、个性化推荐系统的结构及在当当网运用中的具体表现 1)个性化推荐系统在电子商务网站中的结构 a 输入功能模块 b推荐引擎模块 c输出功能模块 2)个性化推荐系统在当当网中的具体运用 a商品信息页面 b购物车、收藏夹 c Email邮件 d独立的个性化页面 3)个性化推荐系统在当当网中的新运用 4)个性化推荐系统在当当网未来的发展趋势 五、个性化推荐系统在当当网运用中的特点 1)“当当推荐”系统功能分析及推荐效果评价 a 当当推荐系统功能 b 推荐效果评价 2)当当网特性化推荐2.0 六、个性化推荐系统在当当网运用中的不足与风险 1)个性化推荐系统在当当网运用中的不足 2)当当网个性化推荐运用中的风险

3)在个性化推荐上当当网和亚马逊的对比分析 七、通过当当网浅谈个性化推荐系统对电子商务发展的影响 1)电子商务新时代的到来 2)由推网的兴起 八、结语与建议 九、注解与参考文献

个性化推荐系统在当当网中的运用分析 摘要:在完善用户购物体验方面,当当网还针对用户需求推出了“为你推荐”功能,通过对顾客历史数据的分析,根据不同顾客的购物习惯向他们推荐针对其个人的商品。这样的定制推荐把用户从海量的商品信息中解放出来,极大的减少了用户的时间成本,通过强大的系统分析,实际上做到了顾客给自己推荐商品,成为自己的顾问。一个好的个性化推荐就好像网站里的智能导购员一样,只不过它是隐形的,对于购物者来说,它是无处不在的。它能将隐形而无处不在的特性发挥到极致,让购物者不讨厌它,也时刻能使用到它,最终,它能够为网站创造更多的销量。 关键词:个性化推荐;当当网;应用;电子商务;信息超载。 Personalized recommendation system in dangdang network analysis of the application Abstract: To improve the user shopping experience,dangdang also according to user needs introduced a \"recommend\" function,through the analysis of the historical data of customers,according to different customers' shopping habits to their recommended according to the personal goods.This custom recommend the user from mass of commodity information liberate, greatly reduce the user's time cost, through the powerful system analysis, in fact do the customer to recommend commodities, to become their own advisers. A good personalized recommend like website intelligent shopping guide,only it is invisible, for shoppers for, it is everywhere. It can store and the ubiquity of characteristics to acme, let shoppers don't hate it, time can be used to it, eventually, it can create more sales for the web site Key words:Personalized recommendation ; dangdang; apply ; electronic commerce;information overload

相关主题