11 2016 档案

摘要:In the series of implementing Recommendation engines, in my previous blog about recommendation system in R, I have explained about implementing user b 阅读全文
posted @ 2016-11-30 17:03 payton数据之旅 阅读(204) 评论(0) 推荐(0)
摘要:A Quick View of Recommender System The main task of recommender system is to predict unknown entries in the rating matrix based on observed values, as 阅读全文
posted @ 2016-11-30 16:58 payton数据之旅 阅读(246) 评论(0) 推荐(0)
摘要:话题一:数据挖掘在会员分析方面的应用 现在我们开始第一个话题的讨论: 1、数据挖掘在会员分析方面的应用,包括并不限于会员分级、精准营销、交叉销售、流失分析等。 汪尚: 今天的机会真的很好,我之前一直做的是线下的分析,今天能和知乎的专家一起交流,刚好能够互补,也希望大家能够踊跃参与进来,把这个平台真正 阅读全文
posted @ 2016-11-30 16:27 payton数据之旅 阅读(1469) 评论(0) 推荐(0)
摘要:推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐 阅读全文
posted @ 2016-11-30 11:41 payton数据之旅 阅读(529) 评论(0) 推荐(0)
摘要:ALS 是什么? ALS 是交替最小二乘 (alternating least squares)的简称。 在机器学习的上下文中,ALS 特指使用交替最小二乘求解的一个协同推荐算法。 它通过观察到的所有用户给产品的打分,来推断每个用户的喜好并向用户推荐适合的产品。 协同过滤 常被应用于推荐系统,旨在补 阅读全文
posted @ 2016-11-30 00:02 payton数据之旅 阅读(2372) 评论(0) 推荐(0)
摘要:Many sites nowadays use recommendation engines in order to offer additional value to the client and increase revenue. This technology is used for a wi 阅读全文
posted @ 2016-11-29 15:16 payton数据之旅 阅读(791) 评论(0) 推荐(0)
摘要:接着之前写的并行算法parallel包,parallel相比foreach来说,相当于是foreach的进阶版,好多东西封装了。而foreach包更为基础,而且可自定义的内容很多,而且实用性比较强,可以简单的用,也可以用得很复杂。笔者将自己的学习笔记记录一下。 R︱并行计算以及提高运算效率的方式(p 阅读全文
posted @ 2016-11-29 12:00 payton数据之旅 阅读(3970) 评论(0) 推荐(0)
摘要:终于开始攻克并行这一块了,有点小兴奋,来看看网络上R语言并行办法有哪些: 赵鹏老师(R与并行计算)做的总结已经很到位。现在并行可以分为: 隐式并行:隐式计算对用户隐藏了大部分细节,用户不需要知道具体数据分配方式 ,算法的实现或者底层的硬件资源分配。系统会根据当前的硬件资源来自动启动计算核心。显然,这 阅读全文
posted @ 2016-11-29 11:56 payton数据之旅 阅读(4491) 评论(0) 推荐(0)
摘要:简单说下安装过程,一般不会有问题,重点是RMySQL的使用方式。 系统环境说明 Redhat系统:Linux 460-42.6.32-431.29.2.el6.x86_64 系统编码:LANG=zh_CN.UTF-8(中文UTF-8格式) MySQL版本:mysql Ver 14.14 Distri 阅读全文
posted @ 2016-11-24 10:52 payton数据之旅 阅读(386) 评论(0) 推荐(0)
摘要:本节将会学习到: 协同过滤推荐系统 协同过滤推荐系统的R实现 推荐系统的可视化 不同推荐系统的离线实验算法比较及可视化 前言 推荐系统概述 数据构成 数据转换 数据也可转换为数据框类型,或通过normalize()函数进行标准化处理,标准化的目的是为了去除用户评分的偏差、、通过binarize()函 阅读全文
posted @ 2016-11-23 10:42 payton数据之旅 阅读(5237) 评论(0) 推荐(0)
摘要:协同过滤的步骤是: 创建数据模型 —> 用户相似度算法 —>用户近邻算法 —>推荐算法。 基于用户的协同过滤算法在Mahout库中已经模块化了,通过4个模块进行统一的方法调用。首先,创建数据模型(DataModel),然后定义用户的相似度算法(UserSimilarity),接下来定义用户近邻算法( 阅读全文
posted @ 2016-11-22 19:34 payton数据之旅 阅读(7735) 评论(0) 推荐(0)
摘要:引言 在生活中我们怎样给别人推荐呢?是根据我们过去的经验。 现在想象一下,如果现在在现实生活中我们依据数据做我们及时的推荐会怎么样?首先,我们会感觉像一个明智的建议者。其次,我们不再是人类。因此,我们的目的是构建聪明的软件,这个软件要能给我们提供一些令人信服的推荐。 当我们访问像亚马逊、Netfli 阅读全文
posted @ 2016-11-17 18:32 payton数据之旅 阅读(847) 评论(0) 推荐(0)
摘要:Many predictive and machine learning models have structural or tuning parameters that cannot be directly estimated from the data. For example, when us 阅读全文
posted @ 2016-11-16 15:43 payton数据之旅 阅读(363) 评论(0) 推荐(0)
摘要:“Good, better, best. Never let it rest. ‘Til your good is better and your better is best.” – St. Jerome tl;dr H2O now has random hyperparameter search 阅读全文
posted @ 2016-11-16 14:45 payton数据之旅 阅读(711) 评论(0) 推荐(0)
摘要:1 pkgs <- list("hflights", "doParallel", "foreach", "dplyr", "rbenchmark", "data.table") 2 lapply(pkgs, require, character.only = T) 3 4 data(hflights) 5 6 benchmark(replications = 10, orde... 阅读全文
posted @ 2016-11-01 10:17 payton数据之旅 阅读(153) 评论(0) 推荐(0)