搜档网
当前位置:搜档网 › 个性化推荐系统评价方法综述@@

个性化推荐系统评价方法综述@@

个性化推荐系统评价方法综述@@
个性化推荐系统评价方法综述@@

第6卷第3期

复杂系统与复杂性科学 Vo.l 6No .32009年9月 CO M PLEX S YSTE M S AND CO M PLEX I TY SC IENCE Sep .2009文章编号:1672-3813(2009)03-0001-10

个性化推荐系统评价方法综述

刘建国1,2,4,周 涛1,2,4,郭 强2,3,汪秉宏1,4

(1.中国科学技术大学近代物理系理论物理研究所,合肥230026;2.弗里堡大学物理系,瑞士

弗里堡CH -1700;

3.大连民族学院理学院,辽宁大连116600;

4.上海理工大学复杂系统科学研究中心,上海200093)

摘要:根据推荐系统任务的不同,介绍了不同的准确性度量指标以及各自的优缺

点;介绍了准确度之外的其它指标,例如推荐多样性、覆盖率等;指出了目前评价指

标存在的缺陷,以及未来可能的改进方向。

关键词:个性化推荐系统;准确率指标;推荐多样性;覆盖率

中图分类号:TP274.2;N94文献标识码:A

O vervie w of the Eva l uated A lgor ithm s for the

Per s onal R eco mm endation Syste m s

LI U Jian 2guo 1,2,4,Z HO U Tao 1,2,4,G UO Q iang 2,3,WANG B i n g 2hong 1,4

(1.Depart ment ofM o dern Physi cs ,University of Science and Technolo gy of Ch i na ,H e fe,i 230026,Ch i na ;

2.Depa rt m en t of Physi cs ,University of Fr i bo urg ,F ri bourg C H -1700,S w itzer l and ;

3.School of Science ,Da li an Na ti ona li ties University ,Da lian 116600,Ch i na ;

4.R esearch Cente r of Co mp l ex System s ,Un i versity of Shangha i for Sc i ence and Technol ogy ,Shanghai 200093,China)

Abstr act :A ccor d i n g to the syste m tasks ,we i n troduce the d iff eren t accuracy m etrics as well as t h e ir

respecti v e advantages and disadvantages .Furt h er m ore ,ot h er metrics are a lso introduced ,such as the di 2

versity ,coverage and so on .Fi n ally ,we poi n t out the def ects of t h e current eva l u ation ,as we ll as the

possible f uture directions to i m prove .

K ey words :personalized reco mmendati o n syste ms ;accuracymetric ;reco mm endati o n d i v ersity ;coverage

收稿日期:2008-12-05

基金项目:国家重点基础研究发展计划(973计划)(2006CB705500);国家自然科学基金(10635040,60744003,10532060,10472116);辽宁省教

育厅基金(20060140)

作者简介:刘建国(1979-),男,山西临汾人,博士后,主要研究方向为个性化推荐算法、复杂网络。

1 引言

个性化推荐系统通过建立用户与产品之间的二元关系,利用用户已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐,其本质就是信息过滤[1-3]。一个完整的推荐系统由3部分

组成:收集用户信息的行为记录模块、分析用户喜好的模型分析模块和推荐算法模块,其中,推荐算法模块是推荐系统中最为核心的部分。目前的推荐算法主要包括协同过滤推荐算法

[4-7]、基于内容的推荐算法[8-10]、基于用户-产品二部图关系的推荐算法[11-14]及混合推荐算法[15-16]。每年都会涌现大量新的推荐算法,其作者都声称自己的算法在某些方面是最好的。然而,针对特定目的,清晰地鉴别算法的优劣是一个

复杂系统与复杂性科学2009年9月

十分具有挑战性的课题。在不同应用背景下,如何选取恰当的评价准则对算法的表现进行评估,研究者们目前还没有达成共识。

评价推荐算法本质上是十分困难的。1)不同的算法在不同数据集上的表现不同。例如,基于用户的协同过滤算法在用户数量远远大于产品数量的系统上表现不错;反之,这样的算法就不是很实用。相关的影响因素还包括打分稀疏性、打分尺度,以及数据集的其他特性;2)评价的目的也不尽相同,许多研究工作注重于评价算法预测打分的准确度。然而,更早时候,Shardanand U[17]就已经认识到度量系统的错误推荐更有意义。还有一些工作研究了准确度之外影响用户满意度的指标[18-19]。这些指标包括:覆盖率[19]、产品流行性、推荐列表多样性[12]等;3)对不同的数据是否需要在线用户的测试?当打分数据非常稀疏的时候,对电子商务系统的推荐算法进行离线评价就非常困难。这是因为离线测试的时候,通常的做法是把用户选择过的产品随机划分为训练集和测试集,利用训练集的数据预测用户的喜好,进而利用测试集对预测结果进行评估。因此,离线测试只能评价用户/已经打分0的产品。对于用户没有选择或并不知道的产品,推荐算法就无法对这些产品进行评估。如果让在线用户评价,用户可以给每个被推荐的产品打分,从而得到推荐算法的准确度;4)选择哪些指标进行综合评价也十分困难。这4方面的因素直接决定了评价的客观性和合理性。

本文简要回顾了推荐系统已有的推荐指标。首先,介绍了6种评价推荐算法准确度的指标,指出了不同指标的应用环境以及各自的优缺点。其次,介绍了准确度之外的一些评价指标,包括推荐产品的流行性、覆盖率、系统发现新鲜产品的能力以及用户的满意度等。这些指标有助于从准确性之外全面对推荐系统的表现进行客观评估。最后指出了目前的评价指标共同面临的问题,以及可能的发展方向。

2准确度评价指标

绝大多数的推荐系统都利用准确度评价推荐算法的好坏。假设用户可以考察所有产品的信息,并且可以根据自己对产品的偏好程度对产品进行排序,那么准确度可以定义为推荐算法的预测排名与用户的实际排名的贴近度。由于不同系统的任务是不一样的,而且评价指标缺乏标准化,因此很难对不同系统的推荐算法进行比较。针对不同的系统,已有的准确度指标有:预测准确度、分类准确度、排序准确度、预测打分关联、距离标准化指标和半衰期效用指标。

2.1预测准确度

预测准确度考虑推荐算法的预测打分与用户实际打分的相似程度。在预测分值显示给用户的系统中,预测准确度十分重要。例如,在MovieLens系统[20]中,系统给出其它用户评价电影的/星0的平均数,而且给出对某个用户的预测/星0数。预测准确度能够度量系统中预测/星0数与用户实际给出的/星0数的差别。即使一个推荐系统能够为用户提供正常的电影排序,但是由于预测打分不准也可能导致系统不可信。预测准确度的一个经典度量方法是度量系统的预测打分与用户的实际打分的平均绝对误差(Mean Absol u te E r2 ror,简称MAE)[17,21-22]:

MA E=1

c

6c

A=1

v i A-r i A(1)

其中,c为系统中用户i打分产品的个数,r i A为用户的实际打分,v i A为系统的预测打分。推荐算法的准确度是所有用户准确度的平均。平均绝对误差有两个优点:1)计算方法简单,易于理解;2)每个系统的平均绝对误差唯一,从而能够区分两个系统平均绝对误差的差异。在有些系统中,用户只在意推荐列表前端的预测误差,而对系统的整体误差并不是很在意,这时也不适合采用预测准确度进行评估。平均绝对误差在用户偏差的程度比较小时也并不适用,因为用户只关心把好产品错归为坏产品,或者把坏产品错归为好产品的比例。例如,以315个星为界区分好坏,那么把4预测成了5,或者把3预测成了2都对用户没有影响。

与平均绝对误差相关的其它指标有平均平方误差(M ean Squared E rror,简称MSE)和标准平均绝对误差(N or m a lizedM ean Ab solute E rror,简称N MAE)[7]。平均平方误差定义为

R MSE=1

n t

6

(i,A)

v

i A

-r

i A

2(2)

#2 #

第6卷第3期 刘建国,等:个性化推荐系统评价方法综述其中,n t 为系统中用户-产品对(i ,A )的个数。平均平方误差在求和之前对系统预测打分与用户打分误差进行平方,因此打分误差越大,其对平均平方误差的影响会比平均绝对误差更大。标准平均绝对误差的定义为NMA E =MA E /(r m ax -r m in ),其中,r m in 和r max 分别为用户打分区间的最小值和最大值。标准平均绝对误差在打分值的区间内作标准化,从而可以在不同的数据集上对算法的效果进行比较。如果系统中只有用户的二元选择信息,即喜欢或不喜欢,则并不适合采用预测准确度对系统进行评价,这类系统更适合用分类准确度度量系统的推荐质量。

2.2 分类准确度

分类准确度定义为推荐算法对一个产品用户是否喜欢判定正确的比例。因此,当用户只有二元选择时,用分类准确度进行评价较为合适。应用于实际的离线数据时,分类准确度可能会受到打分稀疏性的影响。当评价一个推荐列表的质量时,列表中的某些产品很可能还没有被该用户打分,因此会给最终的评价结果带来偏差。一个评价稀疏数据集的方法就是忽略还没有打分的产品,那么推荐算法的任务就变成了/预测已经打分的产品中排名靠前的产品0。另外一个解决数据稀疏性的方法就是假设存在默认打分,常常对还没有打分的产品打负分[21]。这个方法的缺点就是默认打分常常与实际的打分相去甚远。第3种方法是计算用户打分高的产品在推荐列表中出现的次数,即度量系统在多大程度上可以识别出用户十分喜欢的产品。这种方法的缺点是容易把推荐系统引向偏的方向:一些方法或者系统对某数据集中已知的数据表现非常好,但是对未知的数据表现十分差。

分类准确度评价并不直接评价算法的打分是否准确。如果分类的信息准确无误,与实际打分存在偏差也是允许的。下面简要介绍广泛使用的分类准确度指标:准确率,召回率以及相关的指标。B illsus D 等人[23-26]最先把准确度和召回率引入到推荐系统中,对推荐系统进行评价。假设系统中的产品总数为N,被推荐产品的总数为N s ,其中N s =N rs +N is ,N rs 和N is 分别为被推荐产品中用户喜欢和不喜欢的产品数。相应地,N r n 和N i n 分别为未被推荐产品中用户喜欢和不喜欢的产品数。而N n =N rn +N i n 为未被推荐的产品数。显然,N =N s +N n 。准确率和召回率可以根据表1进行计算。如果用户的打分没有分为两类,则需要进行转换。例如M ovieLens 数据为5分制[20],通常3~5分被认为是用户喜欢的,1~2分被认为是用户不喜欢的。准确率定义为系统的推荐列表中用户喜欢的产品和所有被推荐产品的比率:

表1 准确率、召回率数据表

被推荐产品数未被推荐产品数用户喜欢产品数

N rs N r n 用户不喜欢产品数

N is N in N N s N n

P =N rs

N s (3)准确率表示用户对一个被推荐产品感兴趣的可能性。召回率定义为推荐列表中用户喜欢的产品与系统中用户喜欢的所有产品的比率。 R =N rs N r ,N r =N rs +N rn (4)召回率表示一个用户喜欢的产品被推荐的概率。准确率和召回率可以有两种计算方法:以用户为中心和以系统为中心。以用户为中心的方法中分别计算每个用户的准确率和召回率,再对所有的用户进行平均。这种方法的重点在于考虑用户的感受,保证每个用户对系统表现的贡献强度是一致的。以系统为中心的方法以考察系统的总体表现为目的,不需要对所有用户做平均。准确率和召回率的定义依赖于用户喜欢和不喜欢的产品分类。如何定义用户是否喜欢一个产品,尤其是用户是否喜欢一个没有打分的产品还是十分困难的。在推荐系统中,无法知道用户是否喜欢某些未知的产品,所以召回率在纯粹意义上讲并不适合度量推荐系统。因为召回率需要知道每个用户对未选择产品的喜好,然而这与推荐系统的初衷是相悖的。

Sa r w ar B M 等[25]提出了一种计算召回率的方法。首先,把用户的打分数据随机地分为训练集和测试集。算法利用训练集数据预测用户感兴趣的产品并给出推荐列表。进而,把测试数据中出现在推荐列表前L 个的比例作为召回率。尽管这一方法非常有效,但是召回率与系统的实际情况存在着偏差。因为每个用户打过分的产品只是所有数据的一小部分,因此测试集中用户喜欢的产品也只是所有用户喜欢产品中的一小部分。尤#3#

复杂系统与复杂性科学2009年9月其需要指出的是这个指标严重依赖于每个用户打过分的产品中用户喜欢的产品的比例。如果一个用户仅给一小部分产品打了分,那么系统的测试召回率低并不意味着系统的表现不好。这是因为系统推荐了很多用户没有打分的产品,这些产品中很可能有很多用户原本就非常喜欢。因此,对一个用户打分非常稀疏的数据集,其测试集由于取样过少而无法反映全部数据的真实特性,根据测试集算出指标误差过大,这种情况下即使对于同一数据集而言,不同算法的指标也不具有比较的意义。

利用准确率和召回率对推荐系统进行评价的最大问题在于它们必须要一起使用才能全面评价算法的好坏。Basu C 等[24]提出了一种方法可以同时计算准确率和召回率。把用户的打分数据随机地分为训练集和测试集,利用训练集数据得到推荐列表,再分别计算算法的准确率和召回率。如果假设测试集中用户喜欢和不

喜欢的产品的分布与其在所有产品的分布一致,那么准确率和召回率将与实际值很接近。Cleverdon C W

[27]发现准确率和召回率存在负相关关联,并且取决于推荐列表的长度。因此,如果系统不能返回一个固定长度的推荐列表,就必须提供一个准确率/召回率向量来度量系统的表现。在实际应用的时候,如果系统的任务是发现所有用户喜欢的产品,召回率就变得很重要,因此需要在一定的召回率水平下考虑准确率。为了同时考察准确率和召回率,Pa zzan iM 等把二者综合考虑提出了F 指标

[8]。F 指标定义为F =2PR

P +R

(5)其中,P 为准确率,R 为召回率。由于F 指标把准确率和召回率统一到一个指标,因此得到了广泛的应用。另外一个度量系统分类准确度的重要指标就是ROC 曲线

[28-29]。关于ROC 曲线,有两个不同的概念。

Swets J A [28-29]称之为相对工作特征(R e lative Opera ting Characteristic),然而,更多的人称之为受试者工作特征(Rece iver O perati n g Character istic)[30]。对于推荐系统,H er locker J 等介绍了一种ROC 曲线的画法[18]:

1)确定用户对每个产品感兴趣与否。2)根据预测结果为用户提供一个推荐列表,从图的原点开始,如果预测的产品符合用户喜好,画一个竖线;如果预测的产品不符合实际,画一个横线;如果预测产品还没有被打分,那么抛弃这个产品,并不影响曲线。一个最好的预测系统产生一个竖的ROC 线,随机预测产生从原点到右上角的直线。如果所有用户喜欢的产品都排在不喜欢的产品前面,那么就得到了一条完美的ROC 曲线。ROC 曲线不适合描述多通道打分系统。但是ROC 曲线下的面积与起点和终点构成的长方形的面积之比可以评价系统的辨别好坏产品的能力,这一比例称之为Swet c A 指标[28-29]。H an ley JA [30]指出ROC 曲线下的面积等于系统能够在两个产品中选择正确的概率。

Swet c A 指标的优点是可以用一个数值表征系统的表现,并且不受推荐列表长度的限制。缺点是:1)需要分析每个用户潜在感兴趣的产品;2)只考虑面积。因此,如果推荐列表的某一片段预测结果都正确,那么这一片段中产品的排序前后位置对曲线下的面积没有影响。但是,实际上推荐列表前面的负面影响对用户是十分巨大的;3)识别两条曲线面积的不同需要大量的数据点以保证统计结果的准确度。

2.3 排序准确度

排序准确度用于度量推荐算法产生的列表符合用户对产品排序的程度。对于排列顺序要求严格的系统,排序准确度十分重要。不同于分类准确度,排序准确度指标更适合于评价需要给用户提供一个排序列表的推荐系统。排序准确度对于只需要知道分类准确度的系统来说太敏感了。例如,尽管前10个都是用户感兴趣的,但排序准确度可能很低,因为用户最感兴趣的产品排在了第10位。周涛等

[12]提出用平均排序分(average

ranking score)度量推荐系统的排序准确度,具体定义如下:

r i =L i N (6)其中,N 为训练集中用户未选择的产品个数,L i 为预测集中待预测产品i 在推荐列表中的位置。例如,如果训练集中用户未选择的产品有100个,测试集中用户喜欢的某个产品在推荐列表中排名第10,那么这个产品的排序分就是r i =10/100=011,用户喜欢的所有产品排序分的平均值可以度量系统的准确度。排序分越小,说明系统趋向于把用户喜欢的产品排在前面。反之,则说明系统把用户喜欢的产品都排在了后面。由于平均#4#

第6卷第3期刘建国,等:个性化推荐系统评价方法综述

排序分不需要额外的参数,而且不需要事先知道用户对产品的喜好打分,因此可以很好刻画不同算法对同一数据集的效果。

2.4预测打分关联

预测打分关联分析系统的打分排序与用户实际的打分排序之间的关联关系,常常用于刻画推荐系统的准确度。与预测准确度不同的地方在于,预测打分关联不考虑预测打分与用户打分各单项的偏差,而是考虑两者之间整体的相关程度。推荐系统中,3个常用的相关性描述有Pearson关联[31]、Spea r m an关联[32]和K enda ll c s Tau[33]。Pearson关联度量两个向量的相关度,定义如下:

C=

6(x- x)(y- y)

n7(x- x)27(y- y)2

(7)其中,x和y为两个向量中对应位置的打分值,n为向量的维度。Spear m an关联与Pearson系数一样,只不过x 和y由打分值变成了相应的排序位置。K enda ll c s Tau是另一种计算排名相关性的方法,Tau越大表示系统预测结果越好,反之,则不好。下面为一种计算Ta u的近似方法:

Ta u=

C-D

(C+D+TR)(C+D+TP)

(8)

其中,C为系统预测正确的喜好偏序数,D为预测错误的喜好偏序数,TR为用户打分相同的产品数,TP为具有相同预测值的产品数。假设有3个产品X,Y,Z,用户的打分为5,4,3。系统的预测打分为5,3,4。那么用户对产品的喜好偏序关系为X>Y>Z,而系统给出的预测序列为X>Z>Y。则系统预测正确的序列为X>Y, X>Z,因此C=2。预测错误的序列为Y>Z,因此D=1。用户打分相同的产品为TR=0,系统预测值相同的产品数为TP=0。因此,T au=1/3。尽管简单,上述相关性指标在推荐系统中应用广泛。

预测打分关联的优点是:可以比较多通道打分系统的排名,计算简单且对全部系统只返回一个值。但是不同的计算方法也有各自的缺点。例如,K enda ll c sT au的缺点是给每个等距离交换赋予相等的权重。因此,在推荐列表中排名第1与第2的差别和排名1000与1001的差别一样。而实际上,用户可能只关心排名前10的产品,而永远不会检查排在1000的产品。因此,排名1与2之间的差别对用户的影响更大。Spear m an相关对/弱排序0解决得并不好。所谓弱排序指的是至少两个产品的打分是一样的,反之,每个产品打分都不同的排序叫做完全排序。由于系统会把得分相同的产品排在不同的位置,Spear man对不同的排序的反馈值不一样。但是这并不合理,因为用户并不关心他打分相同的产品是如何排序的。Kenda ll c s Tau也有类似的问题。

2.5距离标准化指标

1995年,Y ao Y Y[34]首次提出距离标准化指标,简称为NDPM。在推荐系统中,NDPM的核心思想为:对比系统预测打分排名与用户实际排名的偏好关系,对基于偏好关系的度量进行标准化,具体定义如下:

NDPM=2c-+c u

2c i

(9)

其中,c-为系统排序与用户排序相冲突的个数,例如,系统认为用户喜欢1超过2,而用户却说正好相反;c u为相容的个数;c i为用户排序中有偏好关系的产品总数。NDP M与Spear m an系数和K enda ll c s Tau相似,但是NDPM的结果更精确。Ba labanovc M和Shoha m Y将NDP M指标用于评价FAB系统的准确度[7],取得了非常好的效果。

2.6半衰期效用指标

推荐系统为用户呈现一个排序的产品列表,但多数用户并不愿意深入浏览这个列表。在I n terne t网页推荐系统中,设计者声称绝大多数的Internet用户不会深入浏览搜索引擎返回的结果,而且用户愿意浏览推荐列表的函数呈指数衰减,这里将衰减强度描述为一个半衰参数。用户i的期望效用R i定义如下[21,35]:

R i=6

j m ax(r i,j-d,0)

2(j-1)/(h-1)

(10)

#5

#

复杂系统与复杂性科学2009年9月其中,r i ,j 为用户i 对推荐列表中排名第j 的产品的打分,d 为默认打分,h 为半衰期。系统的半衰期由所有用户半衰期的平均值得到。为了得到一个高的半衰期效用值,系统必须把用户打分高的产品赋予高的打分值。缺点是如果实际的效用函数不是指数衰减的,那么系统的半衰期效用与用户的实际感受差别就会很大。例如,如果用户常常在推荐列表前20个产品中搜索,那么效用函数只应该对前20个产品赋值,而后的都应设为0。半衰期效用指标有如下两个缺点:1)系统中的弱排序使得即使对同一个系统排序,其结果也不同;2)因为m ax 函数的缘故,所有打分小于默认值的产品的作用相同。

3 准确度之外的评价指标

在实际应用中,我们已经发现准确率高的推荐系统并不能保证用户对推荐系统呈现的结果满意[18]。推荐系统不仅需要高的准确率,还需要得到用户的认可,而后者才是更本质的。例如,系统推荐了非常流行的产品给用户,使得准确度非常高,但是这些信息用户很可能从其他渠道早已得到,因此用户不会认为这样的系统是有价值的。一般而言,系统推荐非流行的产品会使得系统的准确度降低,但这时用户反而容易发现一些新奇的,自己找不到的产品。本节介绍除了准确率之外度量推荐系统的评价指标,包括推荐的流行性和多样性、覆盖率、新鲜性和意外性以及用户的满意度等度量指标。

3.1 推荐列表的流行性和多样性

除了准确度之外,周涛等[12]提出利用推荐产品的平均度和平均海明距离对推荐产品的流行性以及不同推荐列表的多样性进行度量。一个产品的度就是被收藏或购买的次数,产品度越大,说明越流行。如果系统趋向于推荐流行的产品,那么被推荐产品的平均度会很高;反之,平均度会很低。一般而言,被推荐产品的平均度小的系统相对更好。另外,个性化推荐系统设计的宗旨就是针对不同用户的需求给出不同的推荐,因此对不同用户推荐的产品也需要表现出相当的多样性。而准确度高的推荐系统不一定能照顾到不同用户的不

同需求。基于此,周涛等[12]提出利用平均海明距离度量推荐系统中推荐列表的多样性。用户i 和j 推荐列

表的海明距离被定义如下:

H ij =1-Q ij /L (11)

其中,L 为推荐列表的长度,Q ij 为系统推荐给用户i 和j 的两个推荐列表中相同产品的个数。推荐列表的多样性定义为H ij 的平均值3H 4。推荐列表多样性的最大值为1,即所有用户的推荐列表完全不一样;最小值为0,意味着所有用户的推荐列表一模一样。

利用准确度,产品的平均度和海明距离可以对推荐算法进行综合评价

[12]。最近的研究表明,可以找到准确度很高,而且推荐列表的多样性又很大的算法。

3.2 覆盖率

覆盖率定义为可以预测打分的产品占所有产品的比例[18-19]。低覆盖率的系统只能对有限的产品进行评估,因此对用户的意义不大。在推荐系统中,覆盖率尤其重要,因为只有覆盖率高才有可能尽可能多地找到用户感兴趣的产品。覆盖率最简单的计算方法就是随机地选取若干用户-产品对,对每一个用户-产品对都做一次预测,衡量一下可预测的产品占所有产品的比例。正如准确率和召回率必须同时使用一样,覆盖率必须结合准确率进行使用,因为推荐系统不能仅仅为了提高覆盖率而给出一个差的准确率。

3.3 新鲜性和意外性

一些推荐系统具有非常高的准确率和相对合理的覆盖率,但是仅仅有这些,系统可能还是对用户没有任何帮助。例如,如果某购物推荐系统向没有购买牛奶的用户推荐牛奶,在统计上,这或许非常准确:每个人都可能购买牛奶。然而,人们都很熟悉牛奶,即使系统不推荐,用户也会知道是否需要购买。因此,最佳的方案是向用户推荐他们从未购买过,但是感兴趣的产品。音乐或电影推荐系统也是如此,给用户推荐流行的产品,无疑会提高系统的准确率,但是用户不会从系统中得到任何新的信息。

S weari n gen K 等[36]发现用户喜欢系统推荐他们熟悉的产品。这很奇怪,因为推荐系统并没有给用户任何全新的信息。然而,这些用户熟悉的产品会增加用户对推荐系统的信心,这一点非常重要。另外,用户更#6#

第6卷第3期 刘建国,等:个性化推荐系统评价方法综述愿意买熟悉的产品,而不是全新的东西。与此相对应的是用户免费下载资料,他们更愿意选择新鲜的推荐。一些推荐系统试图预测用户对一个产品熟悉的程度。对某些任务,系统推荐用户熟悉的产品;其它情况下,很少或者不推荐用户熟悉的产品。因此,我们介绍两种新的指标度量推荐系统:新鲜性和意外性[36]。推荐用户感到意外的产品会帮助用户发现一些他还没有发现的可能感兴趣的产品。在这里新鲜性和意外性具有本质的不同。例如,考虑一个电影推荐系统,这个系统只考虑用户喜欢的导演信息。如果系统给用户推荐了他喜欢的导演执导的一个自己并不熟悉的电影,这个电影就是新鲜的,但是并不是意外的。如果系统推荐了一个新导演的电影,那么系统提供了一个意外的推荐。从定义的角度来讲,意外的也是新鲜的。区别新鲜性和意外性在推荐系统中是非常重要的,因为基于内容的推荐系统不会给出意外性的推荐,只会给出新鲜性的推荐。

Sar w ar B M 等[37]还讨论了如何修改用户的推荐列表使得新的推荐列表具有新鲜性和意外性。一个简单的方法就是建立一个独立的流行产品列表,在把用户的推荐列表呈现给用户之前,把那些出现在用户推荐列表中的流行产品删除,未删除的产品在推荐列表中的位置自动向前移动。因为每个用户都有不同的经历和爱好,因此每一个用户删除的流行产品应该是不同的。另一个方法是在用户群中把每个用户喜欢某个产品的概率除以群中所有人喜欢这个产品的概率之和,再重新排序,这样可以判断此用户是否比群体中的其它人更喜欢某个产品。流行的产品将推荐给目前没有选择它的用户,而如果非流行的产品符合某个用户的口味,就会被推荐。这个方法将大大地改变每个用户的推荐列表,帮助用户发现令他们意外的他们喜欢的产品。

定义一个指标来度量系统的意外性十分困难,因为意外性是度量推荐系统提供给用户的产品既感兴趣又意外的程度。一个好的意外性指标应该从用户兴趣随时间变化的角度进行推荐。产品在多大程度上属于用户没有买过的类别?如果推荐给用户,用户是否会满意?好的意外性指标希望推荐系统能很好地识别以前不知道的产品。尽管新鲜性和意外性的重要性在2001年就被提出

[36-37],直到目前,还没有系统地定量地研究新鲜性和意外性指标的工作。

3.4 用户的满意度

大多数推荐系统都对推荐给用户的产品进行预测打分。Cosley D 等[38]的研究发现系统的预测打分值

也影响着用户的打分。他们同时发现,系统给出的错误打分会降低用户对系统的满意度。这些关于用户评价的研究显示用户对推荐系统的预测准确度非常敏感。S weari n gen K 和Si n ha R [36]在3个推荐系统上的实

验系统地研究了用户满意度对推荐系统的作用。首先,赋予系统足够的打分,使得可以对用户进行推荐。接着让用户从头至尾浏览推荐列表,直到用户发现一个感兴趣的产品。这个实验能让我们知道,推荐准确度是否真的影响用户的满意度。用户在使用推荐系统的时候必须信任推荐系统,如果系统能向用户解释为什么给用户推荐这些产品,就非常有助于增强用户对系统推荐结果的信心。用户在使用推荐系统的同时也在评价推荐系统。例如,仅仅一个电影的名字并不能说服用户点击看这部电影。因此,系统提供信息的种类和质量也决定了用户是否认可推荐的结果。另外,上述实验中用户的反馈信息表明,系统的满意度并不是用户选择系统的根本原因。以A m azon 和M edia Unbound 为例,用户更愿意从A m azon 网站购买东西。然而,在实际调查中,用户认为MedaU i nbound 更有用,可以更好地理解用户的喜好。进一步的研究表明,A mazon 更多地向用户推荐用户熟悉的产品,这或许是Amaz on 成功的原因之一。因此,用户会在某个目的下选择某个系统,而在另一个目的下选择另一个系统。ChoiceStrea m 的调查结果显示,用户的满意度对推荐系统的错误推荐非常敏感。通常有43%的错误推荐是用户已经购买或拥有的产品,41%的错误推荐是并不适合用户的推荐。

总之,用户对推荐系统的满意度不仅仅取决于系统的准确度,而是更多地取决于系统在多大程度上可以帮助用户完成任务。因此,如果想要度量用户对一个推荐系统的评价,首先这个系统必须对自身的任务有一个清晰的定义,进而,针对特定的任务选择适当的指标对推荐算法进行评价。

#7#

复杂系统与复杂性科学2009年9月4 小结

有效地对推荐系统进行评价是一个非常具有挑战性的课题。本文简要介绍了推荐系统的各种指标及其优缺点,进而介绍了准确性之外评价推荐系统的其它指标。这些指标有些是基于推荐算法的,有些独立于推荐算法,从系统或者用户的角度对推荐系统进行评价。虽然目前为止有些指标还难以量化,只能进行定性的讨论,但是无疑对推荐系统的客观、合理评价具有重要的指导意义。随着W eb2.0技术和互联网技术的迅猛发展,个性化推荐系统的应用越发广泛。实际应用的巨大需求为推荐系统的研究工作带来了巨大的推动力。然而,推荐系统的评价指标至今仍是/乱花渐欲迷人眼0。目前为止,从纷繁复杂的指标群当中找到一个合适指标对系统或算法进行评价还是十分困难的,尤其在需要对比不同系统优劣的时候,更是难以找到可以综合评价系统表现的指标。希望本文的工作可以促进推荐系统研究工作者对推荐系统评价指标的了解,并根据自身系统的任务,选择合适的指标进行进一步的研究工作。

虽然目前已经有很多的评价指标,但是所有这些评价指标都面临着一些共性的问题。这些问题的解决对于推荐系统的研究工作具有非常重要的意义。总结起来,推荐系统的评价工作可以从以下方面继续进行深入研究:

1)用户对算法准确度的敏感度。一个错误的预测会大大降低用户对推荐系统的信心。对于不同的指标,准确率改变多少用户就可以察觉系统的改变?用户对哪个准确度指标最敏感?用户对准确度的感受受到哪些因素影响?其它统计特性如何影响用户的满意度,例如覆盖率、新鲜性等。如果以上问题可以回答,那么我们就可以用离线数据对推荐系统进行测试。

2)算法对不同领域的普适性。不同的推荐算法在不同的数据集上的表现不同。对于某个推荐算法,在什么类型的数据上可以发挥最好的效果。这些需要进行深入的研究。如果这个问题解决了,那么系统设计者可以根据自身数据集的特点选择最适合的算法进行工作。

3)广义的质量评价。大部分评价指标只重视准确度,忽略了覆盖率,新鲜性系统发现新鲜产品的能力以及用户的满意度等特性。因为用户总是同时从多个方面综合评价实际系统,因此准确度高的算法在实际应用中表现却不一定好。是否能把这些指标进行结合,提出一个综合性评价指标,这样系统设计者就可以模仿用户直接对系统进行评价。

4)个人隐私的保护。推荐系统的本质是利用用户现有的选择信息或者配置文件,发掘用户的兴趣、爱好。用户如果希望得到推荐系统的帮助,必须共享一些个人的隐私数据。对系统来说,不仅需要有效保护用户的个人隐私,而且需要在尽可能少利用用户隐私数据的情况下做出准确、合理的推荐。反过来,用户只有在确认系统可以有效保护个人的隐私数据的情况下,才愿意使用推荐系统。因此,未来的准确度指标应该结合个人隐私数据保护的水平进行使用。

5)推荐系统的鲁棒性研究。推荐系统在实际投入应用后,有些恶意用户希望用自己的选择信息破坏系统中正常的用户-产品二元关系。以期降低系统的准确度,改变系统提供给正常用户的推荐列表,从而达到破坏系统本身或抬高某些产品被推荐程度的目的。随着推荐系统的日益广泛使用,系统鲁棒性的研究日益重要。只有经得起这种恶意攻击考验的系统才具有持久的生命力。

感谢张子柯、金慈航、吕琳媛对文章的认真修改和中肯意见。

参考文献:

[1]R es n ick P ,Iakov ou N ,Sushak M,et a.l GroupLens :an open arch itecture for coll aborati ve filter i ng of ne t news [DB /OL ].

[2008-10-12].h ttp ://w w w .s.i u m i ch .edu /~presnick /pape rs /csc w94/Gro upLens .ht m.

[2]H illW,Stead L ,Rosenste i nM,et a.l R eco mm endi ng and eva l uati ng choi ces i n a virt ua l co mmun ity of use[DB /OL].[2008-

10-12].http ://sigch.i org/ch i 95/proceed i ngs/papers /wch_bdy .ht m.

#8#

第6卷第3期 刘建国,等:个性化推荐系统评价方法综述[3]刘建国,周涛,汪秉宏.个性化推荐系统研究进展[J].自然科学进展,2009,19(1):1-15.

Liu Ji anguo ,Zhou Tao ,W ang B i ng hong .P ro gress of the personalized reco mm endatio n system s[J].Progress of Nature and Sc i ence ,2009,19(1):1-15.

[4]Liu R R,Jia C X ,Zhou T ,et a.l Personal reco mm endati on via mod ifi ed collaborati ve filter i ng[J].Physica A ,2009,388:

462-468.

[5]Konstan J A ,M ill e r B N ,M a ltz D ,et a.l G roupLens :applyi ng coll aborati ve filter i ng to usenet news[J].Co mm AC M,1997,

40(3):77-87.

[6]

L i nden G ,Sm ith B ,York J .Amazon .co m reco mm enda ti ons :ite m 2to 2ite m coll abora ti ve filteri ng[J].IEEE Interne t Co m puti ng ,2003,7(1):76-80.[7]

Ba l abanovi c M,Shoha m Y .Fab :conten t 2based ,collaborative reco mm enda ti on[J].Co mm AC M,1997,40(3):66-72.[8]P azzaniM,B ill sus D .Lea rn i ng and revisi ng user profiles :t he i dentifica ti on of interesti ng web sites [J].M ach i ne Learni ng ,

1997,27:313-331.

[9]Mooney R J ,Bennett P N ,R oy L .Bo ok reco mm end i ng using text categor izati on with extracted infor m ati on[DB /OL].[2008-

10-12].http ://c iteseerx .ist .psu .edu /vie wdoc /su mm ary ?doi=10.1.1.16.4905.

[10]Chang Y I ,Shen J H,Chen T I .A data m i n i ng 2based m e t hod f or the i ncre m en tal update of supporti ng personalized i nfor ma ti on

filteri ng[J].Journa l of Inf or m ati on Sc ience and Engi neer i ng ,2008,24(1):129-142.

[11]Zhou T ,R en J ,M edo M,e t a.l B i partite net work proj ec ti on and persona l reco mm endati on [J].

Phys R ev E ,2007,76:046115.

[12]Zhou T ,Jiang L L ,Su R Q,e t a.l E ffect of i n i tia l confi gurati on on ne t w ork 2based reco mmendatio n[J].Europhys Le tt ,2008,

81:58004.

[13]Zhang Y C ,M edo M,R en J ,et a.l R eco mm enda ti on m o de l based on op i nio n diff usio n[J].Europhys Le tt ,2007,80:68003.

[14]Zhou T ,Su R Q ,L i u R R,et a.l U ltra accura te pe rsona l reco mm endati on vi a e li m i nati ng redundant corre lati ons .[DB /OL].

[2008-10-12].http ://arxi v .org /abs/0805.4127

[15]Soboroff I M,N i cholas C K .Co mb i ning co ntent and collaborati on in text filter i ng[DB /OL].[2008-10-12].http ://c i te 2

seerx .ist .psu .edu /vie wdoc /su mm ary ?doi=10.1.1.39.8019.

[16]YoshiiK ,GotoM,Ko m a tan iK ,et a.l An effi c i ent hybrid music reco mm ender system usi ng an i ncre m entall y tra i nable probab i 2

listic generati ve m ode l[J].I EEE T ransacti ons on Audio Speech and Lang uage P rocessi ng ,2008,16(2):435-447.

[17]Shardanand U ,M aes P.Socia l i n f or m ati on filte ri ng :a l gorith m s for auto m ati ng "word of m out h "[C ]//P roceed i ngs of AC M

C H I c 95Co n f e rence on H u m an Factors i n Co m puti ng System s .New York :ACM P ress ,1995,210-217.

[18]H er l ocker J ,Konstan J A ,Terveen L ,e t a.l Eva l uati ng collaborati ve filter i ng reco mm ender syste m s[J].AC M T ransacti ons on

In f or m ati on Syste m s ,2004,22(1):5-53.

[19]Geyer 2Schulz A ,H ahsl e rM,W i enW,et a.l Evalua ti on of reco mm ender a l gor it hms for an internet i n f or m ati on broker based on

si m ple associati on rules and o n t he repea t 2buying theory[DB /OL].[2008-10-12].http ://c iteseerx .i st .psu .edu /vie wdoc /su mm ary ?doi=10.1.1.19.911.

[20]Dah l en B J ,Ko nstan J A ,H er l ocke r J L ,et a.l Ju m pstarting movielens :user bene fits of starti ng a coll abora ti ve filteri ng system

with "dead data "[DB /OL ].[2008-10-12].h ttp ://w w w .b i bsono my .org /bibtex /24433e6aa3be2cdad117bfb5f d7a757a1/bs m yth .

[21]B reese J S ,H ecker m an D ,Kadie C.Emp irica l analysis of predicti ve a l gor it hm s for collaborative filter i ng[DB /OL].[2008-

10-12].http ://w ww .cs .pitt .edu /~m rotaru/co m p /rs /B reese %20UAI %201998.pd.f

[22]H er l ocker J L ,Konstan J A ,Borchers A ,et a.l An a l gor it hm ic fra m ework for per f or m ing collaborati ve filter i ng[C ]//H earstM

A ,Gey F F,Tong R.P roceed i ngs of the 22nd Internatio na l Conference o n R esearch and Develo pment in Infor ma ti on R etr i eva l (SI G I R c 99)(Aug).N e w York :AC M P ress ,1999:230-237.

[23]B illsus D ,Pazzan iM J .Learn i ng collaborative infor m ati on filte rs[C ]//R i ch C ,M osto w J .P roceedi ngs of t he 15th Natio na l

Conference o n A rtific i a l Inte lli gence (A AA I-1998).M en l o Pa rk ,Ca li:f AAAI P ress ,1998:46-53.

[24]Basu C ,H irsh H,Co henW W.R eco mm endati on as classificati on :usi ng soc i a l and co ntent 2based i nfor m atio n i n reco mm enda 2

tio n[C]//R i ch C,M osto w J .P roceed i ngs of the 15th Na ti ona l Co nfe rence on Artificial In telli gence (AA A I-1998).M en l o #

9#

复杂系统与复杂性科学2009年9月

P ark ,Ca li:f AAA I P ress ,1998:714-720.

[25]Sarwa r B M,Ka rypis G ,Konstan J A,et a.l Analysis of reco mm enda ti on a l gor it hm s for e 2co mm erce [C]//P roceedi ngs of the

2nd AC M Co n ference on E lectro n ic Co mme rce (EC c 00).Ne w York :AC M P ress ,2000:285-295.

[26]Sar war B M,K aryp i s G ,Konstan J A ,e t a.l Appli catio n of d i m ensio na lity reducti on i n reco mm ende r syste m )a case st udy[DB /

OL].[2008-10-12].http ://ro botics .stanford .edu /~ronny k /WEBKDD2000/pape rs /sar war .pd.f

[27]C leverdo n C W,M ills J ,K ean M.F actors Deter m i n i ng the Perfor mance of Indexi ng Syste m s[M ].Engl and :C ranfield (Beds),

1966.

[28]Swets J A .Infor ma ti on retr i eva l syste m s[J].Science ,1963,141:245-250.

[29]Swets J A .Effecti veness of i nfor m a tion re trieval m ethods[J].Am er Doc ,1969,20:72-89.

[30]H anley JA ,M cne il B J .The meaning and use of the area under a rece i ver o perati ng character i sti c (ROC)curve[J].R ad i olo gy

1982,143:29-36.

[31]R o dgers J L ,N ice wande rW A .Th irteen ways to loo k a t t he correlatio n coe fficient[J].The A m er i can S tatistician ,1988,42:

59-66.

[32]Spear m an C .The pro of and m easure m ent of assoc i atio n bet ween t wo t h i ngs[J].Ame r J P sycho,l 1904,15:72-101.

[33]Kenda llM.A new m easure of rank corre lati on[J].B i o m etr i ka ,1938,30:81-89.

[34]Yao Y Y.M easuring re trieval e ffecti veness based o n user pre ference of docu m ents[J].J ASIS ,1995,46:133-145.

[35]H ecke r man D ,Ch ickering D M,M eek C ,et a.l Dependency net w orks for i nfe rence ,coll abora ti ve filtering ,and data vis ua liza 2

tio n[J].JM ach Lea rn R es ,2000,1:49-75.

[36]Swea ri ngen K ,S i nha R.Beyond algor it h m s :an HC I perspec tive on reco mm ende r syste m s[DB /OL].[2008-10-12].htt p ://

w w w .citeuli ke .org/use r/l sch iff/article /375842.

[37]Sarwa r B M,Karyp i s G ,Konstan J ,et a.l Ite m 2based collaborati ve filter i ng reco mm endatio n a l gor ith m s[DB /OL].[2008-10-

12].htt p ://ww https://www.sodocs.net/doc/8c1830343.html,/cdro m /papers/pdf/p519.pd.f

[38]Cos l ey D ,Lam S K ,A lbe rt I ,et a.l Is see i ng be lieving ?ho w reco mm ender interfaces affect users c op i n i ons[DB /OL].[2008-

10-12].http ://w ww .gro uplens .org/papers /pdf/co nfor m -ch i 03.pd.f #10#

个性化推荐系统分析与设计

课程设计报告 课程名称系统分析设计与开发方法 课题名称个性化推荐系统的分析与设计 专业信息管理与信息系统 班级1002 学号201003110215 姓名黄天玲 指导教师唐志航 2014年元月4 日

一、设计内容与设计要求 1.设计内容: 见附录 2.设计要求: 1).设计正确,方案合理。 2).界面友好,使用方便。 3).建模语言精炼,结构清晰。 4).设计报告4000字以上,含建模语言说明,用户使用说明,UML建模图。 5).上机演示。 二、进度安排 第十七周星期四下午:课题讲解,查阅资料、系统分析 星期五上午:总体设计、详细设计 第十八周星期一:建模,上机调试、撰写课程设计报告 星期二下午:答辩 附: 课程设计报告装订顺序:封面、任务书、目录、正文、评分、附件(A4大小的图纸及程序清单)。 正文的格式:一级标题用3号黑体,二级标题用四号宋体加粗,正文用小四号宋体;行距为22。

设计课题:个性化推荐系统的分析与设计 一、问题描述: 对网络购物个性化推荐系统进行分析与设计,对购物流程进行分析,对购物中关键环节进行设计,实现对商品的录入、显示、修改、排序、保存、销售、售后服务以及客户管理等操作实现推荐结果准确性、推荐结果多样性、用户交互度、系统界面设计、系统交互设计、推荐透明度(推荐解释)。 二、功能要求: 1、用UML完成一个小型团购系统的分析、设计。 2、写出系统需求报告,说明系统的功能。 3、通过面向对象的分析和设计建立系统模型。 4、画出完整的用例图、类图、对象图、包图;及时序图、协作图、状态图、活动图;及组件图和配置图) 三、建模提示: 1、使用Enterprise Architect 8.0建模。 2、使用 Ration Rose 或StarUML建模。 四、其它 对该系统有兴趣的同学可以在实现上述基本功能后,完善系统的其它功能,特别是售后以及客户关系管理。

综合评价方法综述与比较

综合评价方法综述与比较 综合评价的概念:所谓统计综合评价,通常就是指多指标综合评价技术,它是利用一定的统计指标体系,采用特定的评价模型和方法,对被评价对象多个方面的数量特征进行高度的抽象和综合,转化为综合评价值,进而确定现象的优劣、类型或对现象进行排序的一种统计方法。目前常用的方法有层次分析法、盗用函数法、多元统计综合评价技术法(包括主成分分析法、因子分析法、聚类分析法等)。此外像人工神经网络综合评价法、模糊综合评判法、灰色系统理论等新兴综合评价技术还在源源不断地涌现。 一简易的综合评价方法 (一),综合指数法 1,直接综合法概念:直接综合法是在确定一套合理的指标体系基础上,对各项指标个体指数进行相加,直接计算出综合评价指数。优点:公式简单易懂,指标数值计算简便。缺点:得到的数值比较粗糙,以此得到的数据进行评价结果精确度不高。 2,加权综合法概念:加权综合法是在确定一套合理的指标体系的基础上,对各项指标个体指数进行加权平均,计算出综合评价数值。优点:与直接综合法相比,加权综合法指标数值的计算考虑到了各指标的比重问题,将各指标赋予不同的权重,以体现不同指标的不同重要程度。缺点:各指标的重要程度的判断具有很大主观性。 (二) 功效系数法概念:功效系数综合评价法是指根据多目标规划的原理,把所要考核的各项指标按照多档次标准,通过功效函数转化为可以度量的评价分数,据以对被评价对象进行总体评价得分的一种方法。优点:方法简便和可操作性强是这种方法的优点所在。缺点:竞争力评价中,不同行业各指标的重要程度有所不同,而权数是由评判人员主观确定,因此科学性有所欠缺,往往评价结果与实际状况出入较大。 (三)综合积分法概念:综合积分法是对构成评价指标体系的每个指标评分,将所有得分相加算出总分,作为综合评价数值的一种评价方法。适用范围:适用于定量分析且变量指标可以用数字表达的评价分析。优点:此法操作简单,结果与、易于理解。缺点:对各指标变量的评分比较主观,没有客观精确地评分公式。 二运筹学中综合评分法 (一)层次分析法概念:AHP法(Analytic Hierarchy Process, AHP),即层次分析法,是美国著名运筹学家,匹兹堡大学萨蒂教授于本世纪七十年代创立的一种实用的多准则决策方法。它把一个复杂决策问题表示为一个有序的递阶层次结构,通过人们的比较判断,计算各种决策方案在不同准则及总准则之下的相对重要性量度,从而据之对决策方案的优劣进行排序。优点:1,系统性的分析方法;2,简洁实用的决策方法;3,所需定量数据信息较少;缺点:1,不能为决策提供新方案;2,定量数据较少,定性成分多,不易令人信服;3,指标过多时数据统计量大,且权重难以确定;4,特征值和特征向量的精确求法比较复杂; (二)模糊评价法概念:模糊评价法是根据模糊数学的隶属度理论把定性评价转化为定量评价的一种方法。优点:(1)为定性指标定量化提供了有效的方法,实现了定性和定量方法的集合。(2)在客观事物中,一些问题往往不是绝对的肯定或绝对的否定,涉及到模糊的因素,而且模糊综合判别评价法则很好的解决了判别的模糊和不确定的问题。(3)所得结果为一向量,即评语集在其论语上的子集,克服了传统数字学方法结果单一的缺陷,结果包含的信息丰富。缺点:(1)不能解决评价指标间相关造成的信息重复的问题。(2)各因素权重的确定带有一定的主观性。(3)在某些情况下,隶属函数的确定有一定困难,尤其是多目标评价模型,要对每一目标,每一个因素确定隶属函数,过于繁琐,实用性不强。应

个性化推荐知识汇总

一 基于协同过滤(collaborative filtering,CF)的推荐系统通过收集来自其他相似用户或项目的评价信息,自动预测当前用户的兴趣偏好。协同过滤的基本假设是用户会更喜欢那些相似用户偏爱的商品,已被广泛应用在一些大型的商业系统,如亚马逊和阿里巴巴等。 目前,协同过滤算法主要包括基于内存的、基于模型的以及二者相混合的推荐技术”。使用最多的模型是k最近邻(k-nearest neighbor,kNN)协同过滤技术,包括基于用户推荐和基于项目推荐两种技术。 一般说来,本体描述了某个应用领域的概念和概念之间的关系,使得它们具有唯一确定的含义,获得该领域的相关知识,提供对该领域知识的共同理解,便于用户和计算机之间进行交流。 OntoECRec推荐模型 二 1995年,卡内基·梅隆大学的A.RDben等人在美国人工智能协会上提出了个性化导航系统we-watcher,真正标志着个性化服务的开始;1997年3月,(communications of the AcM)。组织了个性化推荐系统的专题报道,标志着个性化服务已经被技术界高度重视;1999年,德国Dresden技术大学的J.Tania 实现了个性化电子商务原型系统TELLIM,标志着个性化服务开始向全球发展;2000年,NEc研究院的D.B.Kurt等人为搜索引擎atesecr增加了个性化推荐功能,实现citeseer的个性化。2001年,纽约大学的GediminaS Adomavicius 和Alexander Tuzhilin实现了个性化电子商务网站的用户建模系统1:1Pro。 个性化推荐服务体系结构中,信息收集模块是个性化服务系统的基础模块。用户的信息包括了用户的个人基本资料、购买的历史记录及浏览记录等。个人基本资料可以从用户注册表单中获得;购买的历史记录主要存放于电子商务网站的后台交易数据库中,包含了每位用户以前历次购物的详细情况记录,如购物时间、商品清单、价格、折扣等,同时也可以收集用户放入购物篮而未购买的商品记录,以及用户过去浏览过的商品信息等。当然要搜集用户的行为信息,日志文件是必不可少的,如要收集服务器日志,则要在服务器端获取,抽取出特定用户的访问记录;如要收集用户浏览的页面和浏览行为,则既可以在用户端获得,也可以在服务器端从用户记录中获得。

推荐系统调研报告及综述

推荐系统调研报告及综述 张永锋 清华大学计算机系人工智能研究所 zhangyf07@https://www.sodocs.net/doc/8c1830343.html, 一、推荐系统概述 1.1 什么是推荐系统 推荐系统(Recommender System)的发展已经经历了近20年的时间,但是迄今为止仍没有人试图对推荐系统给出一个精确的定义。 广义上的推荐系统可以理解为是主动向用户推荐物品(Item)的系统,所推荐的物品可以是音乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,这依赖于具体的应用领域,推荐系统所推荐的物品或者对用户有帮助,或者用户可能感兴趣[1]。 随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(Personalized Recommender System)应运而生[1]。目前所说的推荐系统一般指个性化推荐系统。 1.2 推荐系统的发展历史 如果追根溯源,推荐系统的初端可以追溯到函数逼近理论、信息检索、预测理论等诸多学科中的一些延伸研究。 推荐系统成为一个相对独立的研究方向一般被认为始自1994年明尼苏达大学GroupLens研究组推出的GroupLens系统[2]。该系统有两大重要贡献:一是首次提出了基于协同过滤(Collaborative Filtering)来完成推荐任务的思想,二是为推荐问题建立了一个形式化的模型(见1.4)。基于该模型的协同过滤推荐引领了之后推荐系统在今后十几年的发展方向。 GroupLens所提出的推荐算法实际上就是目前人们时常提及的基于用户的协同过滤推荐算法(User-based Collaborative Filtering Algorithms),虽然论文本身并没有使用这样一个名字。在之后的十几年中,其它一些著名的协同过滤算法逐渐被提出,主要的有基于物品的协同过滤算法(Item-based Collaborative Filtering Algorithms)[3],基于矩阵分解的协同过滤算法(SVD-based/NMF-based, etc.)等等。当然,基于其它方法而非协同过滤的推荐算法也在不断地发展,这些方法之间的互补、融合也成为一个重要的研究方向,这些会在本文第二部分(推荐方法的分类)和第三部分(典型推荐算法概述及优缺点)中详细阐述。 目前,推荐算法已经已经被广泛集成到了很多商业应用系统中,比较著名的有Netflix在线视频推荐系统、Amazon网络购物商城等。实际上,大多数的电子商务平台尤其是网络购物平台,都不同程度地集成了推荐算法,如淘宝、京东商城等。Amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。

(完整版)评价方法综述

评价方法综述 综合评价是指对以多属性体系结构描述的对象系统作出全局性、整体性的评价,即对评价对象的全体根据所给的条件,采用一定的方法给每个评价对象赋予一个评价值,再据此择优或排序。 常用的综合综合评价方法可以分为以下几大类: (1)定性评价方法,包括专家会议法、德尔菲法(Delphi法)。这类方法具有操作简单,可以利用专家的知识,结论易于使用的优点,但是主观比较强,多人评价是结论难收敛,适合于不能或难以量化的大系统,简单的小系统。 (2)技术经济分析方法,包括经济分析法和技术评价法,分别通过价值分析、成本效益分析、价值功能分析,采用NPV(Net Present value)、IRR(Internal Rate of Retum)等指标和通过可行性分析、可靠性评价等。该方法含义明确,可比性强,但是建立模型比较困难,只适用评价因素少的对象。 (3)多属性决策方法(Multi Attribute Decesion-makingMethod,简称DADM),这类方法通过化多为少、分层序列、直接求非劣解、重排次序法莱排序与评价,具有描述精确,可以处理多决策者、多指标、动态的对象的优点,但由于隶属刚性的评价,无法涉及模糊因素的对象。 (4)系统工程法,包括评分法、关联矩阵法和层次分析法(Analytic Hierarchy Proeess,简称AHP),前两者具有方法简单、容易操作的优点,但只能用于静态评价;AHP法的可靠度比较高,误差小,但评价对象的因素不能太多(通常不多于9个)。 (5)模糊数学方法,包括模糊综合评价、模糊积分、模糊模式识别等,能克服传统数学方法中的“唯一解”的弊端,根据不同可能性得出多个层次的问题解,但不能解决评价指标间相关造成的信息重复问题,隶属函数、模糊相关矩阵等的确定方法有待进一步研究。 (6)物元分析方法与可拓评价,可以解决评价对象的指标存在不相容性和可变性的问题。 (7)统计分析方法,包括主成分分析、因子分析、聚类分析和判别分析等,具有全面性、可比性、客观合理的优点,但都需要大量的统计数据,没有反映客观发展水平。

对于个性化推荐新闻的思考

对于个性化推荐新闻的思考 作者:王慧 来源:《传媒论坛》2019年第01期 摘要:个性化推送作为新兴媒体背景下一种新的新闻分发形式,对受众有着正反两方面的意义,无论是新闻定制,还是算法分发,其困境背后实际上是技术不断发展过程中工具理性与人文理性的永恒博弈。媒体应该对聚合类信息内容的把关,个性化推荐与人性化推荐相融合,推送未曾关注的领域,增加新闻偶遇的机会。以算法为主进行分发的新兴媒体同专业媒体应该共同满足受众对于信息的需求,其中既包括个性化,也包括公共性,只有这样才能形成唐纳德肖所提出的专业媒体与大众媒体纵横交错的“纸草社会”,在算法时代守望人的价值。 关键词:算法;人文理性;工具理性 中图分类号:G210 文献标识码:A 文章编号:2096-5079 (2019) 01-00-02 个性化推荐新闻即根据用户的性别、年龄、自定义、访问信息类别需求倾向等特征来给用户推荐特定的信息内容,具有个性化、定制化、移动化、互动性等特点。正如“今日头条”APP 所说:“投其所好,送其需要”。个性化推荐新闻对受众有积极消极两方面的影响,新闻媒体仍应提供必要的社会公共信息,担任社会协调与整合的职责。而在CEO张一鸣看来,《今日头条》与传统媒体最本质的区别就是算法。这款兴趣推荐搜索引擎应用的核心是算法,今日头条之所以能够洞察用户喜好,精准分发用户感兴趣的新闻,很大程度上与算法是分不开的。 本文将从以下几个角度,探索有关这个算法王国的几个问题:媒体人的老帝国与算法技术新帝国的融合的前景(代价)是什么?对于受众有何影响,可能的误区在哪里?以下将以今日头条APP为例来探讨个性化推荐新闻对受众的影响。 一、算法于人之利 (一)满足分众化信息需求,精准分发,提高用户黏性 个性化推荐新闻基于计算机程序运作,提高了精准程度的新闻分发使得不同类型的内容信息被机器识别,推送给有着不同需求的受众,根据使用与满足理论,受众面对大众传媒绝不是完全被动的,事实上受众总是自主地选择自己所好奇的和所需要的媒介内容和信息。受众信息消费的选择范围也随着网络技术的普及不断扩大,受众的个性化需求成为了媒体始终绕不开的话题。今日头条的slogan“你关心的,才是头条”这也充分体现了互联网思维的极致发挥。分配逻辑的首位是观众的需求,同时媒体的市场覆盖面也得到了显著的提高,更是获得了受众认可,创始短短几年就对“腾讯新闻”等老牌新闻客户端产生了极大的威胁。

个性化推荐算法概述与展望

Hans Journal of Data Mining 数据挖掘, 2019, 9(3), 81-87 Published Online July 2019 in Hans. https://www.sodocs.net/doc/8c1830343.html,/journal/hjdm https://https://www.sodocs.net/doc/8c1830343.html,/10.12677/hjdm.2019.93010 Overview and Prospect of Personalized Recommendation Algorithm Xinxin Li Dalian University of Foreign Languages, Dalian Liaoning Received: Jun. 19th, 2019; accepted: Jul. 2nd, 2019; published: Jul. 9th, 2019 Abstract In recent years, the word “information overload” frequently appears in people’s vision, it has be-come a hot word in the field of computer, and it is also an important problem that researchers ur-gently need to solve. In order to solve the problem of information overload, researchers in the field of computer constantly optimize the personalized recommendation algorithm, strive to re-duce the difficulty of information retrieval for users, to provide users with the best personalized recommendation results. This paper gives a brief overview of the personalized recommendation methods which are widely used and common. Combined with the experience of using personalized recommendation algorithm to generate results in daily life, the author puts forward expectations for the development of personalized recommendation algorithm in the future. Keywords Personalized Recommendation, Collaborative Filtering, Hybrid Recommendation 个性化推荐算法概述与展望 李鑫欣 大连外国语大学,辽宁大连 收稿日期:2019年6月19日;录用日期:2019年7月2日;发布日期:2019年7月9日 摘要 近年来,“信息过载”一词频繁出现在人们的视野中,它成为了计算机相关领域中的热门词汇,同时它也是研究人员急待解决的重要问题。为解决信息超载的问题,计算机领域研究人员不断优化个性化推荐

面向移动APP的个性化推荐算法

龙源期刊网 https://www.sodocs.net/doc/8c1830343.html, 面向移动APP的个性化推荐算法 作者:尚燕飞陈德运杨海陆 来源:《哈尔滨理工大学学报》2018年第06期 摘;要:针对移动互联网移动端的推荐系统推荐满意度和精度较低问题,在分析应用信息系统推荐方法的基础上,提出了一种基于用户相似度和主题相似度个性化的移动APP信息推荐方法,该方法采用用户相似度和个性化加权组合的方式生成信息推荐,使推荐信息更为个性化,提高了推荐精度。同时针对多用户公用账号和兴趣发生变化的推荐问题,提出了一种基于复杂兴趣的推荐算法,该方法通过挖掘用户间的相似度、用户的行为操作及兴趣取向,使推荐信息更为准确。同时,相比于性能较好的Popular推荐算法,本算法在准确率上提高了 3.91%,召回率提高了3.45%,覆盖率提高了 4.84%,性能明显提高。因此,文中所提出方法 用于移动APP的个性化推荐,为移动APP的个性化推荐提供了一种新方法。 关键词:移动APP;推荐算法;推荐精度;个性化信息 DOI:10.15938/j.jhust.2018.06.021 中图分类号: TP393.08 文献标志码: A 文章编号: 1007-2683(2018)06-0116-08 Abstract:For the problem of low precision to both experience satisfaction and personalized requirement of Internet mobile terminal;based on the recommendation method of analyzing information system;a method of mobile APP information recommendation based on user similarity and subject similarity is proposed;which generated information recommendation by the weighted combination of user similarity and personalized;that the recommended information is more personalized;and the recommended accuracy is improved. At the same time;a recommendation algorithm based on complex interest is proposed;which makes the recommendation information more accurate by mining the similarity between users;the behavior of users and the orientation of interest for the recommendation problem of multi-user public account and interest change. Compared with the Popular which has better performance;the algorithm improves the accuracy rate by 3.91%;the recall rate is 3.45%;the coverage rate is improved by 4.84%;and the performance is improved obviously. Therefore;the method proposed in this paper is used to the personalized recommendation of APP;which provides a new method for mobile APP′s personalized recommendation. Keywords:mobile application;recommendation algorithm;the accuracy of recommending;personalized information 0;引;言

个性化推荐系统研究综述

个性化推荐系统研究综述 【摘要】个性化推荐系统不仅在社会经济中具有重要的应用价值,而且也是一个非常值得研究的科学问题。给出个性化推荐系统的定义,国内外研究现状,同时阐述了推荐系统的推荐算法。最后对个性化推系统做出总结与展望。 【关键词】推荐系统;推荐算法;个性化 1.个性化推荐系统 1.1个性化推荐系统的概论 推荐系统是一种特殊形式的信息过滤系统(Information Filtering),推荐系统通过分析用户的历史兴趣和偏好信息,可以在项目空间中确定用户现在和将来可能会喜欢的项目,进而主动向用户提供相应的项目推荐服务[1]。传统推荐系统认为推荐系统通过获得用户个人兴趣,根据推荐算法,并对用户进行产品推荐。事实上,推荐系统不仅局限于单向的信息传递,还可以同时实现面向终端客户和面向企业的双向信息传递。 一个完整的推荐系统由3个部分组成:收集用户信息的行为记录模块,分析用户喜好的模型分析模块和推荐算法模块,其中推荐算法模块是推荐系统中最为核心的部分。推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。 1.2国内外研究现状 推荐系统的研宄开始于上世纪90年代初期,推荐系统大量借鉴了相关领域的研宄成果,在推荐系统的研宄中广泛应用了认知科学、近似理论、信息检索、预测理论、管理科学以及市场建模等多个领域的知识。随着互联网的普及和电子商务的发展,推荐系统逐渐成为电子商务IT技术的一个重要研究内容,得到了越来越多研究者的关注。ACM从1999年开始每年召开一次电子商务的研讨会,其中关于电子商务推荐系统的研究文章占据了很大比重。个性化推荐研究直到20世纪90年代才被作为一个独立的概念提出来。最近的迅猛发展,来源于Web210技术的成熟。有了这个技术,用户不再是被动的网页浏览者,而是成为主动参与者[2]。 个性化推荐系统的研究内容和研究方向主要包括:(1)推荐系统的推荐精度和实时性是一对矛盾的研究;(2)推荐质量研究,例如在客户评价数据的极端稀疏性使得推荐系统无法产生有效的推荐,推荐系统的推荐质量难以保证;(3)多种数据多种技术集成性研究;(4)数据挖掘技术在个性化推荐系统中的应用问题,基于Web挖掘的推荐系统得到了越来越多研究者的关注;(5)由于推荐系统需要分析用户购买习惯和兴趣爱好,涉及到用户隐私问题,如何在提供推荐服务的

个性化推荐技术综述

个性化推荐技术综述 在互联网时代,各类信息层出不穷,用户往往面临着“信息过载”的困扰,难以在大量信息中找到有价值的信息。而个性化推荐则通过用户的兴趣特点和历史行为快速高效的为用户推荐用户感兴趣的信息或商品。通常情况下,根据推荐方式的不同,推荐技术大概可以分为以下几个类型: 1.协同过滤的推荐算法 协同过滤推荐算法由Goldberg、Nicols、Oki和Terry 在1992年提出,该算法应用在Tapestry系统。Breese 等人将协同过滤推荐技术分为两种类型,一种是基于内存的协同过滤方法,另一种是基于模型的协同过滤方法,各自常用的算法如图1所示。基于内存的协同推荐( memory-based collaborative filtering) 也称为启发式的协同推荐,主要直接利用用户的历史数据来提供预测结果。根据相似性度量的对象的不同,基于内存的协同过滤又分为User-based 协同过滤和Item-based协同过滤。User-based 协同过滤的基本原理是如果一些用户对一些物品评价的分数比较接近,那么通常情况下他们评价其它物品的分数也会很接近。那么我们要得到某个用户对物品的评分时,就可用和该用户评分相似的其他用户对目标物品的评分去估计。Item-based协同过滤的基本原理是如果一些物品的典型特征具有相似性,那么同一个用户对他们的评分是接近的。基于上述原则,如果我们得到用户对和目标物品相似的其它物品的评分时,那么我们就可以通过这些分数来逼近用户对目标物品的评分。基于模型(Model-based)的推荐算法是首先通过用户-项目评分矩阵训练得到一个决策模型,在为目标用户进行推荐时,利用该离线模型为用户进行预测产生推荐结果。大致理念就是通过机器学习算法,在数据中找出模式,并将用户与物品间的互动方式模式化。

个性化推荐系统的文献综述

个性化推荐系统在电子商务网站中的应用研究 一、引言 随着Internet的普及,信息爆炸时代接踵而至,海量的信息同时呈现,使用户难以从中发现自己感兴趣的部分,甚至也使得大量几乎无人问津的信息称为网络总的“暗信息”无法被一般用户获取。同样,随着电子商务迅猛发展,网站在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。 个性化推荐,被认为是当前解决信息超载问题最有效的工具之一.推荐问题从根本上说就是从用户的角度出发,代替用户去评估其从未看过的产品,使用户不只是被动的网页浏览者,而成为主动参与者。准确、高效的推荐系统可以挖掘用户的偏好和需求,从而成为发现用户潜在的消费倾向,为其提供个性化服务。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手断,更重要的是可以增进用户的黏着性。本文对文献的综述包括个性化推荐系统的概述、常用的个性化推荐系统算法分析以及个性化推荐系统能够为电子商务网站带来的价值。 二、个性化推荐系统概述 个性化推荐系统是指根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于:网站最热卖商品、客户所处城市、客户过去的购买行为和购买记录,推测客户将来可能的购买行为。 1995年3月,卡内基 梅隆大学的Robert Armstrong等人在美国人工智能协会首次提出了个性化导航系统Web-Watcher,斯坦福大学的Marko Balabanovic 等人在同一次会议上推出了个性化推荐系统LIRA。同年8月,麻省理工学院的

个性化推荐系统中的多样性综述

Software Engineering and Applications 软件工程与应用, 2019, 8(3), 172-178 Published Online June 2019 in Hans. https://www.sodocs.net/doc/8c1830343.html,/journal/sea https://https://www.sodocs.net/doc/8c1830343.html,/10.12677/sea.2019.83021 A Survey of Diversity in Personalized Recommendation Systems Shuhao Jiang1,2, Liyi Zhang1,2, Na Zhou1 1School of Electrical and Information Engineering, Tianjin University, Tianjin 2School of Information Engineering, Tianjin University of Commerce, Tianjin Received: June 6th, 2019; accepted: June 21st, 2019; published: June 28th, 2019 Abstract Diversity has become one of the main directions of recommendation system research. Improving the diversity of recommendation content is not only an important way to solve the problem of over-fitting, but also a way to improve user’s experience satisfaction. In order to elaborate the work in the field of recommendation diversity, this paper introduces diversity recommendation from three aspects: the definition and evaluation of diversity, the impact of diversity on recom-mendation quality and the development of diversity algorithm. Keywords Personalized Recommendation, Diversity, Recommendation Quality, Evaluation 个性化推荐系统中的多样性综述 姜书浩1,2,张立毅1,2,周娜1 1天津大学电气自动化与信息工程学院,天津 2天津商业大学信息工程学院,天津 收稿日期:2019年6月6日;录用日期:2019年6月21日;发布日期:2019年6月28日 摘要 多样性已成为推荐系统研究的主要方向之一,提高推荐内容的多样性不仅是解决过度拟合问题的重要方法,也是提高用户体验满意度的方法。为了更好地阐述推荐多样性领域的工作,本文分别从多样性的定义和评价、多样性对推荐质量的影响以及多样化算法本身的发展三个方面对多样性推荐进行了介绍。

个性化推荐算法概述与展望

个性化推荐算法概述与展望 近年来,随着网络信息技术的不断发展与进步,网民数量激增,网络覆盖率日益增高。互联网行业发展迅速,购物、出行、医疗、教育等生产生活中的方方面面都有着“互联网+”的影子。在这个网络化、信息化的时代,网络技术已经在潜移默化地影响着、改变着人们的生活方式与思想观念。“信息过载”一词频繁出现在人们的视野中,它成为了计算机相关领域中的热门词汇,同时它也是研究人员急待解决的重要问题。 为解决信息超载的问题,计算机领域研究人员不断优化个性化推荐算法,力求降低用户的信息检索难度,为用户提供最优的个性化推荐结果。在汉斯出版社《数据挖掘》期刊中,有论文对于应用范围较广、较为常见的个性化推荐方法做出简要的概述,并结合日常生活中使用个性化推荐算法生成结果的经历,对未来个性化推荐算法的发展提出期望。 基于信息超载的情况,个性化推荐算法应运而生。个性化推荐系统通过挖掘用户在网络上留下的“信息足迹”,采集并分析用户的网络行为与消费偏好,根据不同的推荐算法将精准的、契合度高的内容推荐给用户。个性化推荐算法的产生与发展极大地便利了人们的生产与生活,对于用户而言,不用再为在海量的信息中检索需要的内容而苦恼,对于商家而言能够更好地分析用户行为,提高竞争力与实现经济效益的最大化增长。 个性化推荐方法分为协同过滤推荐、基于内容的推荐以及混合推荐。协同过滤推荐主要思想是通过现有的用户群以往的意见和行为,对当前用户最有可能感兴趣的物品进行预测。基于内容推荐是指通过掌握的物品特征的描述和描述了用户历史兴趣的记录,确定最能匹配用户喜爱的物品并推荐给用户。混合推荐算法来提高推荐结果的准确程度,是为克服协同过滤算法、基于内容算法等其他算法的局限性、提高个性化推荐结果的精准度,研究者将两种

综合评价方法综述

现代综合评价方法综述 张晶 管理科学与工程

现代综合评价方法综述 摘要:将现代综合评价方法归纳、分类,讨论了各方法的原理、优缺点及适用领域,并提出综合评价方法研究的趋势及存在问题。 0引言 评价是人类社会中一项经常性的、极为重要的认识活动。对一个事物的评价常常要涉及多个因素或多个指标,评价是在多因素相互作用下的一种综合判断。综合评价概指对以多属性体系结构描述的对象系统作出全局性、整体性的评价,即对评价对象的全体,根据所给的条件,采用一定的方法给每个评价对象赋予一个评价值,再据此择优或排序。 1现代综合评价方法分类及基本方法 评价方法的分类很多,按照评价与所使用信息特征的关系,可分为基于数据的分析、基于模型的评价、基于专家知识的评价以及基于数据、模型、专家知识的评价。由于本文的定位是现代综合评价方法,根据各评价方法所依据的理论基础,把综合评价方法大致分为四大类: 1.1 专家评价方法 1.1.1 专家打分评判法 专家评分法是出现较早且应用较广的一种评价方法。它是在定量和定性分析的基础上,以打分等方式做出定量评价,其结果具有数理统计特性。主要步骤是:首先根据评价对象的具体情况选定评价指标,对每个指标均定出评价等级,每个等级的标准用分值表示;然后以此为基准,由专家对评价对象进行分析和评价,确定各个指标的分值;最后采用加法评分法、加权评分法、连乘评分法或加乘评分法求出各评价对象的总分值,从而得到评价结果。专家评分法的最大优点是,在缺乏足够统计数据和原始资料的情况下,可以做出定量估价,专家评价法具有使用简单、直观性强的特点。但专家评价的准确程度,主要取决于专家的阅历经

推荐系统调研报告及综述

推荐系统调研报告及综述 一、推荐系统概述 1.1 什么是推荐系统 推荐系统(Recommender System)的发展已经经历了近20年的时间,但是迄今为止仍没有人试图对推荐系统给出一个精确的定义。 广义上的推荐系统可以理解为是主动向用户推荐物品(Item)的系统,所推荐的物品可以是音乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,这依赖于具体的应用领域,推荐系统所推荐的物品或者对用户有帮助,或者用户可能感兴趣[1]。 随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(Personalized Recommender System)应运而生[1]。目前所说的推荐系统一般指个性化推荐系统。 1.2 推荐系统的发展历史 如果追根溯源,推荐系统的初端可以追溯到函数逼近理论、信息检索、预测理论等诸多学科中的一些延伸研究。 推荐系统成为一个相对独立的研究方向一般被认为始自1994年明尼苏达大学GroupLens研究组推出的GroupLens系统[2]。该系统有两大重要贡献:一是首次提出了基于协同过滤(Collaborative Filtering)来完成推荐任务的思想,二是为推荐问题建立了一个形式化的模型(见1.4)。基于该模型的协同过滤推荐引领了之后推荐系统在今后十几年的发展方向。 GroupLens所提出的推荐算法实际上就是目前人们时常提及的基于用户的协同过滤推荐算法(User-based Collaborative Filtering Algorithms),虽然论文本身并没有使用这样一个名字。在之后的十几年中,其它一些著名的协同过滤算法逐渐被提出,主要的有基于物品的协同过滤算法(Item-based Collaborative Filtering Algorithms)[3],基于矩阵分解的协同过滤算法(SVD-based/NMF-based, etc.)等等。当然,基于其它方法而非协同过滤的推荐算法也在不断地发展,这些方法之间的互补、融合也成为一个重要的研究方向,这些会在本文第二部分(推荐方法的分类)和第三部分(典型推荐算法概述及优缺点)中详细阐述。 目前,推荐算法已经已经被广泛集成到了很多商业应用系统中,比较著名的有Netflix在线视频推荐系统、Amazon网络购物商城等。实际上,大多数的电子商务平台尤其是网络购物平台,都不同程度地集成了推荐算法,如淘宝、京东商城等。Amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。

评价指标权重确定方法综述

权重确定方法论述 班级:环境工程1101 姓名:杜江涯 学号:1109050134

评价指标权重确定方法综述 摘要:对于一个多方案的多属性决策问题,由于其问题的复杂性,往往表现为多属性的综合评价.综合评价是决策的前提,正确的决策来源于对各方案的科学的综合评价.本文主要讨论了多属性综合评价过程中评价指标的权重的确定问题.一般来说,构成多属性综合评价的要素有:评价者或决策者;被评价对象或方案;指标集;权重系数和综合评价模型等.其中,各指标权重的确定是核心问题.关于权重的确定,一般分为主观赋权法和客观赋权法两大类,这两类方法各有利弊.为了消除主观赋权法和客观赋权法各自的不足,人们又提出了集成主、客观权重的组合赋权方法.目前,集成权重方法的研究已成为多属性决策问题的研究热点,取得了不少的研究成果.本文的结构如下:第一节简要介绍了多属性决策的模式和评价指标的建立、筛选以及评价指标的规范化方法.第二节介绍了主、客观赋权法的含义和特征,以及一些常用的主、客观赋权法的方法和特点.第三节介绍了运用一种主观权重和一种客观权重集成指标最终权重的研究成果.第四节将第三节中的运用一种主观权重和一种客观权重集成最终权重的模型推广到已知p(p≥1)种主观权重和q(q≥1)种客观权重集成最终权重的情形;并对已有的一些集成指标最终权重的模型做了改进,改进后的模型使得各指标权重的确定更加方便、简洁;同时,建立了新的基于最优化理论和Jaynes最大熵原理的集成指标最终权重的模型;最后,通过算例验证了作者所提出的这些方法的有效性. Abstract: in many practical problems, the training data is different, usually some training data may be more important than other data. Each group of training data depict different function is usually through each training data gives an incredible weights, based on the fuzzy data, this paper has deduced the classic again in the regression method, and the relative cases of fuzzy regression method, and analyzed their statistical properties. In fuzzy statistic analysis of the traditional methods are incredibly weight by setting the fuzzy membership functions, such as to determine the time sequence function etc. Considering the DEA method in the analysis of the relative effectiveness evaluation decision unit has not underestimate the superiority of the DEA method, then we introduce fuzzy statistic analysis, and usually use the fuzzy membership functions of the incredible weight determined comparing method,

个性化推荐系统在当当网中的运用分析

目录 一、摘要 二、当当网概述 1)当当网简介 三、个性化推荐系统营销理论综述及原因 1)个性化推荐系统营销概念及分类 a 基于内容的推荐系统 b 协同过滤推荐系统 c 混合推荐系统 2)个性化推荐系统的发展历程 3)当当网使用个性化推荐系统的原因 四、个性化推荐系统的结构及在当当网运用中的具体表现 1)个性化推荐系统在电子商务网站中的结构 a 输入功能模块 b推荐引擎模块 c输出功能模块 2)个性化推荐系统在当当网中的具体运用 a商品信息页面 b购物车、收藏夹 c Email邮件 d独立的个性化页面 3)个性化推荐系统在当当网中的新运用 4)个性化推荐系统在当当网未来的发展趋势 五、个性化推荐系统在当当网运用中的特点 1)“当当推荐”系统功能分析及推荐效果评价 a 当当推荐系统功能 b 推荐效果评价 2)当当网特性化推荐2.0 六、个性化推荐系统在当当网运用中的不足与风险 1)个性化推荐系统在当当网运用中的不足 2)当当网个性化推荐运用中的风险

3)在个性化推荐上当当网和亚马逊的对比分析 七、通过当当网浅谈个性化推荐系统对电子商务发展的影响 1)电子商务新时代的到来 2)由推网的兴起 八、结语与建议 九、注解与参考文献

个性化推荐系统在当当网中的运用分析 摘要:在完善用户购物体验方面,当当网还针对用户需求推出了“为你推荐”功能,通过对顾客历史数据的分析,根据不同顾客的购物习惯向他们推荐针对其个人的商品。这样的定制推荐把用户从海量的商品信息中解放出来,极大的减少了用户的时间成本,通过强大的系统分析,实际上做到了顾客给自己推荐商品,成为自己的顾问。一个好的个性化推荐就好像网站里的智能导购员一样,只不过它是隐形的,对于购物者来说,它是无处不在的。它能将隐形而无处不在的特性发挥到极致,让购物者不讨厌它,也时刻能使用到它,最终,它能够为网站创造更多的销量。 关键词:个性化推荐;当当网;应用;电子商务;信息超载。 Personalized recommendation system in dangdang network analysis of the application Abstract: To improve the user shopping experience,dangdang also according to user needs introduced a \"recommend\" function,through the analysis of the historical data of customers,according to different customers' shopping habits to their recommended according to the personal goods.This custom recommend the user from mass of commodity information liberate, greatly reduce the user's time cost, through the powerful system analysis, in fact do the customer to recommend commodities, to become their own advisers. A good personalized recommend like website intelligent shopping guide,only it is invisible, for shoppers for, it is everywhere. It can store and the ubiquity of characteristics to acme, let shoppers don't hate it, time can be used to it, eventually, it can create more sales for the web site Key words:Personalized recommendation ; dangdang; apply ; electronic commerce;information overload

相关主题