天大电子商务推荐系统的研究与实现

 

第一章,阐明本文课题的选题背景和研究现状,并说明本文的主要内容和创
新点。
第二章,介绍电子商务推荐系统的作用,分类,构成,主要的推荐技术。
第三章,详细阐述了集成语义信息的电子商务推荐系统的系统设计,并给出
关键的集成语义信息的协同过滤技术的算法设计和性能试验。
第四章,阐述如何在集成语义信息的电子商务推荐系统中记录用户动态偏
好、构建和应用用户语义偏好模型,以及表达和解析用户偏好。
第五章,描述了结合协同过滤和语义过滤推荐,实现电子商务个性化推荐系
统的整体应用背景,系统分析和设计以及功能。
第六章,对本文的研究工作进行总结,提出存在问题,并对未来该领域研究
前景做出展望。.

 

电子商务推荐系
统产生的推荐可以基于电子商务系统的销售排行,可以基于用户以前的购买行
为,也可以基于用户表现出来的兴趣爱好等。

 

电子商务推荐系统的作用主要
表现在三个方面:①将电子商务网站的浏览者转变为购买者;②提高电子商务网
站的交叉销售能力(cross selling);⑨提高客户对电子商务网站的忠诚度。

 

一根据用户获得推荐的自动化程度和持久性程度,可以将将电子商务推荐系统
分为非个性化电子商务推荐系统,基于属性的电子商务推荐系统,商品相关性推
荐系统和用户相关性推荐系统⋯。
1).非个性化电子商务推荐系统:向当前用户提供的推荐结果可能基于其
他用户对商品的平均评价,或者基于电子商务系统的销售排行,或者基于电子商
务系统的编辑推荐。这种推荐技术独立于各个用户,每个用户得到的推荐都是相
同的。非个性化电子商务推荐系统属于自动化方式推荐,产生的推荐基于用户的
单个会话。典型例子包括Amazon提供的Average Customer Rating推荐,eBay提
供的Customer Comments推荐。
2).基于属性的电子商务推荐系统:根据商品的属性特征向用户产生推荐
列表,这种推荐系统类似于搜索引擎,用户需要手工输入所需商品的属性特征。
基于属性的电子商务推荐系统需要用户显式输入商品的属性特征,因此属于手工
方式推荐。产生的推荐可以基于用户的单个会话,也可以基于用户的多个会话。
典型例子包括flJllazon提供的Delivers推荐,Reel提供的Movie Map推荐。
3).商品相关性推荐系统:根据商品之间的相关性向用户产生相应的推荐。
商品相关性推荐系统可以是全自动化推荐系统,也可以是全手工方式推荐系统。
这种推荐技术一般是基于用户的单个会话。典型例子如Amazon提供的Customers
who bought this book also bought推荐,CDNOW提供的Album Advisor推荐。
4).协同过滤推荐系统:又称为用户相关性推荐系统,这种推荐系统首先搜
索当前用户的最近邻居,然后根据最近邻居的购买历史或评分信息向当前用户产
生推荐。用户相关推荐一般不书要用户显式输入信息。产生的推荐一般是基于用
户的多个会话。典型例子包括Amazon提供的Book Matcher推荐,Movie Finder
提供的We Predict推荐。

 

23电子商务推荐系统的构成
整个电子商务推荐系统的组成主要可以分为三个模块:输入功能(Input
functional)模块、推荐方法(Recommendation method)模块、输出功能(Output
functional)模块。
输入模块主要负责对用户信息的收集和更新。输入可来自客户个人和社团群
体两部分。客户个人输入(Targeted Customer Inputs)主要指目标用户,即要
求获得推荐的人为得到推荐而必须对一些项目进行评价,以表达自己的偏好,包
括隐式浏览输入、显式浏览输入、关键词和项目属性输入和用户购买历史等。社
团群体输入(Community Inputs)主要指集体形式的评价数据,包括项目属性、社
团购买历史、文本评价、等级评分。
输出模块主要负责在系统获得输入信息后,输出推荐给用户的内容。主要形
式有①建议(Suggestion),又分为单个建议(Single Item)、未排序建议列表
(Unordered List)、排序建议列表(Ordered List),典型的如Top-At:推荐系统
根据客户的喜好向客户推荐最可能吸引客户的前N件产品;②预测(Prediction):
系统对给定项目的总体评分;③个体评分(IndividualR ating):输出其他客户
对商品的个体评分;④评论(Review):输出其他客户对商品的文本评价。
推荐方法模块是推荐系统的核心部分,负责由输入如何得到输出,决定着推
荐系统的性能优劣。推荐方法模块以推荐技术和算法为技术支撑。

 

2.4电子商务推荐系统中的推荐技术
目前在电子商务活动中,广泛使用的推荐技术主要有协同过滤推荐、基于关
联规则的推荐、基于用户统计信息的推荐、基于内容的推荐、基于效用的技术和
基于知识的技术等,各种推荐技术的简明算法步骤见表2:1【121。
表2.1推荐技术方法比较
推荐技术背景条件输入主要步骤
协同过滤推荐U对I的评价U对I的评价等识别u的邻居用户;根据
级其生成i的评价分
基于内容推荐I的特征属性U对I的评价等根据U的评价分生成项目
级的分类器

基于人口统计U的人口统计信关于U的人口统识别u的相似用户根据其
信息推荐息及对I的评价计信息生成i的评价分
基于效用推荐I的特征描述U对I偏好把效用函数用于各项目;
的效用函数生成各项目的排序
基于知识推荐I的特征、I如何对U需要和兴趣计算各项目I和用户需要
满足用户的知识的描述的匹配程度
基于规则推荐U对I的浏览或购浏览购买记录生成关联规则;根据规则
买历史生成推荐

协同过滤(collaborative filtering)(CF)是应用最广泛最成熟的推荐技
术,它的基本思想是由其他用户的资料协同过滤得到对目标用户的推荐。用户资
料由各项目及用户对各项目的评分组成的向量表示,即用户一项目矩阵。矩阵中
的数据是用户对项目的评分。对目标用户的所有可能的推荐,肯定都包含在项目
集I中。协同过滤的意思,就是如何把这个I集过滤后只剩下给目标用户的N个推
荐项目。在CF技术中,一般都不考虑用户的兴趣会因为时间的推移而发生的变化,
即认为用户对项目的评分是不随时间改变的。主要采用CF技术的著名的系统有
GroupLens/NetPerceptions,Ringo/Firefly及Tapestry和Recommendation。协同
过滤对推荐对象本身并没有特殊的要求,它所关注的只是用户对项目的评价信
息。
’所有推荐技术都有其优点和缺点,如表2.2tlzJ所示。

本文的核心内容,集成语义信息的协同过滤推荐技术,即是将基于项目的协
同过滤与语义过滤技术进行组合的技术,协同过滤技术的优点是利用其他用户的
结果来扩展信息的广度和精确度,而语义过滤技术具有挖掘用户隐含兴趣,达到
语义推测目的的优点。我们融合了以上这两种技术,给用户的推荐结果即完整准
确又能更人性化地去迎合用户的偏好。

第三章集成语义信息的电子商务推荐系统——ERSIS

有点类似于tag,商品的多维语义

3.2.3语义信息库
在语义信息库中,针对每个行业产品的语义信息都可以用一个MxN阶矩阵
表示,M行代表M个产品,Ⅳ列代表Ⅳ个该行业的语义关联项,第m行第n列的元
素以删代表产品m对语义关联项n的权重值,行业语义信息矩阵如表3一l所示。
表3-1行业语义信息内部存储表示
语义项1 语义项2 语义项3 语义项n
产品1 2 3 4 2
产品2 3 l 5 2
产品3 2 4 5 1
产品4 2 4 5 3
产品m 3 2 4 2

 

基于内存的

用户协同过滤,项目协同过滤,

基于模型的

聚类,关联,贝叶斯,机器学习

 

3.3.1推荐算法的设计
推荐系统的关键是推荐算法的设计,一般说来,要试图对用户推荐一个目标
项目i,方法是考察所有该用户已经评价过的项目,然后选择k个与i最相似的项
目{‘,f2,...,t),通过计算i与这k个项目的相似度来生成用户对目标项目i的预测
评价值。协同过滤技术是目前最受欢迎的推荐技术,在协同过滤研究领域里有两
种主要方法:基于用户的协同过滤瞄”(User-Based Collaborative Filtering)
和基于项目的协同过滤瞄刮(Item-Based Collaborative Filtering)。IBCF方法
可以相对克fl艮UBCF方法的扩展性问题,这种方法通过考虑项目与项目之间的关系
避免了用户与用户之间的计算的瓶颈。在我们的方法里,我们把基于项目的协同
过滤技术与我们提出的语义过滤技术结合起来,整个推荐过程由以下四个步骤组
成:

1)基于IBCF方法的项目相似度计算。
用户评分数据可以用一个m×n阶矩阵A(m,n)表示,m行代表价用户,n列代
表n个项目,第i行第j列的元素代表用户i对项目j的评价值。用户评分数据矩阵
如图3-5所示。

设有两个项目f,和i,,这里s,t∈N。为了全面考虑影响用户权重,在这里
使用经过修正的余弦相似性方法计算基于IBCF方法相似度。我们把同时评价过
i。和i,的用户集合用u表示,R^表示用户u对i,的评价值,民表示第u个用户
对所有项目评价值的平均值。我们用J帆(‘,‘)表示项目i。与i,之间的相似度: 州“):T&坠犁皿(3_1)
√Σ剃(咒,‘-瓦)2√Σ删(兄,‘-瓦)2

对于同行业的产品间的语义相似计算,我们以M个产品项目的列表
,={矗,之,...,0)做为列标识,以N个语义项目列表S={丑,而,...,&}做为行标识,它
们构成的NxM矩阵。里面的每个值‰都代表第m个产品项目对第n个语义项的
语义相关权重。

集成上述这两种相似度方法并以他们的线性结合得到最终的产品项目相似
度计算公式:
sim(i,,‘)=a*sirr6(‘,‘)+(1一口)木s毗(之,‘)(3-3)
’在这里,口是一个0到1范围的权重值,我们称为语义权重参数。我们通过
为特定的产品项目集合执行语义分析来对它选择合适的值。

我们选择k个-9目标项目最相似的项目构成集合K,通过这个k个项目为目
标项目生成一个预测值。我们使用加权法计算预测评价值并且生成推荐。该方法
通过计算用户u在与目标项目i相似的其他k项上面的权重总和来计算用户u对
i的预测值只.『. 巳=一c3二

 

我觉得我们可以让用户调参数,呵呵

 

 

posted @ 2009-04-29 09:53  minmin8110  阅读(556)  评论(0编辑  收藏  举报