博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

文章分类 -  数据分析和数据挖掘

摘要:Posted on2012 年 5 月 15 日bypr@baifendian.com问题定义:现有的一些推荐算法,特别是协同过滤推荐算法,它们容易受到外界认为攻击的影响,例如在Amazon上,有些用户刻意地对自己的商品评高分,而对竞争对手的商品评低分,这样一来,Amazon的推荐系统就更容易推荐这些人的商品,而其他人的商品就很难被推荐。这就有点像在google搜索引擎里面,有些用户通过特定的方式来提高自己网站的pagerank值。到目前为止,这种攻击有很多种,针对不同的算法有不同的攻击,本章节就是主要讨论攻击的种类,评价指标以及推荐算法在受到这些攻击时候的表现情况。问题描述:图1 攻击框架攻 阅读全文

posted @ 2012-09-17 11:33 刘乐 阅读(337) 评论(0) 推荐(0)

摘要:在网上看到一篇文章介绍五个免费开源的数据挖掘软件,转过来。 Orange Orange是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++和 Python开发,它的图形库是由跨平台的Qt框架开发。 RapidMiner RapidMiner,以前叫 YALE (Yet Another Learning Environment),其是一个给机器学习和数据挖掘和分析的试验环境... 阅读全文

posted @ 2012-08-30 11:10 刘乐 阅读(166) 评论(0) 推荐(0)