打赏
上一页 1 ··· 80 81 82 83 84 85 86 87 88 ··· 180 下一页
摘要: Apriori的挑战及改进方案 挑战 多次数据库扫描 巨大数量的候补项集 繁琐的支持度计算 改善Apriori: 基本想法 减少扫描数据库的次数 减少候选项集的数量 简化候选项集的支持度计算 FPGROWTH算法优点 相比Apriori算法需要多次扫描数据库,FPGrowth只需要对数据库扫描2次。 阅读全文
posted @ 2017-04-30 12:08 大数据和AI躺过的坑 阅读(11867) 评论(0) 推荐(2)
摘要: 贝叶斯决策 简单例子引入 先验概率 后验概率 最小错误率决策 最小风险贝叶斯决策 简单的例子 正常情况下,我们可以快速的将街上的人分成男和女两类。这里街上的人就是我们观测到的样本,将每一个人分成男、女两类就是我们做决策的过程。上面的问题就是一个分类问题。 分类可以看作是一种决策,即我们根据观测对样本 阅读全文
posted @ 2017-04-30 11:43 大数据和AI躺过的坑 阅读(2147) 评论(0) 推荐(1)
摘要: Mahout的推荐系统 什么是推荐系统 为什使用推荐系统 推荐系统中的算法 什么是推荐系统 为什么使用推荐系统? 促进厂商商品销售,帮助用户找到想要的商品 推荐系统无处不在,体现在生活的各个方面 图书推荐;QQ好友推荐;优酷,爱奇艺的视频推荐;豆瓣的音乐推荐;大从点评的餐饮推荐;世纪佳缘的相亲推荐; 阅读全文
posted @ 2017-04-30 10:31 大数据和AI躺过的坑 阅读(13192) 评论(1) 推荐(2)
摘要: Tachyon实战应用 配置及启动环境 修改spark-env.sh 启动HDFS 启动Tachyon Tachyon上运行Spark 添加core-site.xml 启动Spark集群 读取文件并保存 Tachyon运行MapReduce 修改core-site.xml 启动YARN 运行MapR 阅读全文
posted @ 2017-04-29 21:41 大数据和AI躺过的坑 阅读(505) 评论(0) 推荐(0)
摘要: Tachyon命令行使用 Tachyon接口说明 接口操作示例 copyFromLocal copyToLocal ls和lsr count cat mkdir、rm、rmr和touch pin和unpin Tachyon接口说明 接口操作示例 copyFromLocal copyToLocal l 阅读全文
posted @ 2017-04-29 21:25 大数据和AI躺过的坑 阅读(707) 评论(0) 推荐(0)
摘要: Tachyon的配置 Tachyon环境变量 Tachyon通用配置 TachyonMaster配置 TachyonWorker配置 用户配置 Tachyon环境变量 Tachyon通用配置 TachyonMaster配置 TachyonWorker配置 用户配置 1 Tachyon的配置 这里以0 阅读全文
posted @ 2017-04-29 21:16 大数据和AI躺过的坑 阅读(881) 评论(0) 推荐(0)
摘要: Tachyon编译部署 编译Tachyon 单机部署Tachyon 集群模式部署Tachyon 编译Tachyon 单机部署Tachyon 集群模式部署Tachyon 1、Tachyon编译部署 Tachyon目前的最新发布版为0.7.1,其官方网址为http://tachyon-project.o 阅读全文
posted @ 2017-04-29 21:10 大数据和AI躺过的坑 阅读(578) 评论(0) 推荐(0)
摘要: 算法说明 协同过滤(Collaborative Filtering,简称CF,WIKI上的定义是:简单来说是利用某个兴趣相投、拥有共同经验之群体的喜好来推荐感兴趣的资讯给使用者,个人透过合作的机制给予资讯相当程度的回应(如评分)并记录下来以达到过滤的目的,进而帮助别人筛选资讯,回应不一定局限于特别感 阅读全文
posted @ 2017-04-29 20:24 大数据和AI躺过的坑 阅读(7348) 评论(1) 推荐(1)
摘要: 算法说明 线性回归是利用称为线性回归方程的函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析方法,只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归,在实际情况中大多数都是多元回归。 线性回归(Linear Regression)问题属于监督学习(Supervised Le 阅读全文
posted @ 2017-04-29 20:05 大数据和AI躺过的坑 阅读(2825) 评论(0) 推荐(0)
摘要: 算法说明 聚类(Cluster analysis)有时也被翻译为簇类,其核心任务是:将一组目标object划分为若干个簇,每个簇之间的object尽可能相似,簇与簇之间的object尽可能相异。聚类算法是机器学习(或者说是数据挖掘更合适)中重要的一部分,除了最为简单的K-Means聚类算法外,比较常 阅读全文
posted @ 2017-04-29 19:46 大数据和AI躺过的坑 阅读(1731) 评论(0) 推荐(0)
上一页 1 ··· 80 81 82 83 84 85 86 87 88 ··· 180 下一页