上一页 1 ··· 75 76 77 78 79 80 81 82 83 ··· 119 下一页

2013年11月9日

Mahout 系列之--canopy 算法

摘要: Canopy 算法,流程简单,容易实现,一下是算法 (1)设样本集合为S,确定两个阈值t1和t2,且t1>t2。 (2)任取一个样本点p属于S,作为一个Canopy,记为C,从S中移除p。 (3)计算S中所有点到p的距离dist (4)若dist<t1,则将相应点归到C,作为弱关联。 (5)若... 阅读全文

posted @ 2013-11-09 14:07 代码王子 阅读(279) 评论(0) 推荐(0)

Mahout系列之-----相似度

摘要: Mahout推荐系统中有许多相似度实现,这些组件实现了计算不能User之间或Item之间的相似度。对于数据量以及数据类型不同的数据源,需要不同的相似度计算方法来提高推荐性能,在mahout提供了大量用于计算相似度的组件,这些组件分别实现了不同的相似度计算方。 User 相似度: ... 阅读全文

posted @ 2013-11-09 13:08 代码王子 阅读(253) 评论(0) 推荐(0)

Mahout系列之----距离度量

摘要: x = (x1,...,xn) 和y = (y1,...,yn) 之间的距离为 (1)欧氏距离 EuclideanDistanceMeasure (2)曼哈顿距离 ManhattanDistanceMeasure (3)马氏距离MahalanobisDi... 阅读全文

posted @ 2013-11-09 13:01 代码王子 阅读(223) 评论(0) 推荐(0)

Mahout系列之----共轭梯度预处理

摘要: 对于大型矩阵,预处理是很重要的.常用的预处理方法有: (1) 雅克比预处理 (2)块状雅克比预处理 (3)半LU 分解 (4... 阅读全文

posted @ 2013-11-09 12:21 代码王子 阅读(225) 评论(0) 推荐(0)

2013年11月8日

Mahout 系列之----共轭梯度

摘要: 无预处理共轭梯度 要求解线性方程组 ,稳定双共轭梯度法从初始解 开始按以下步骤迭代: 任意选择向量 使得 ,例如, 对 若 足够精确则退出 预处理共轭梯度 预处理通常被用来加速迭代方法的收敛。要使用预处理子 来求解线性方程组 ,预处理稳定双共轭... 阅读全文

posted @ 2013-11-08 17:58 代码王子 阅读(270) 评论(0) 推荐(0)

git使用详解

摘要: 1. Git概念 1.1. Git库中由三部分组成 Git 仓库就是那个.git 目录,其中存放的是我们所提交的文档索引内容,Git 可基于文档索引内容对其所管理的文档进行内容追踪,从而实现文档的版本控制。.git目录位于工作目录内。 1)工作目录:用户本地的目录; 2) Index(索引... 阅读全文

posted @ 2013-11-08 17:38 代码王子 阅读(153) 评论(0) 推荐(0)

Hive 配置

摘要: hive.metastore.local false javax.jdo.option.ConnectionURL jdbc:mysql://hadoop23:3306/hive?createDatabaseIfNotExist=true&amp;useUnicode... 阅读全文

posted @ 2013-11-08 17:35 代码王子 阅读(192) 评论(0) 推荐(0)

Lucene 自动补全

摘要: package com.pera.suggestion; import java.io.IOException; import java.io.Reader; import java.util.ArrayList; import java.util.HashMap; import java.... 阅读全文

posted @ 2013-11-08 17:20 代码王子 阅读(309) 评论(0) 推荐(0)

my project 中git使用过程(基本操作流程)

摘要: 1.g it clone git@name:server/BM/APPS.git 则BM_APPS.git项目被下载到当前目录下了,这时git@name:server/BM/APPS.git就是自己的origin库。 2.为自己的仓库定义别名 为方便以后操作,可给... 阅读全文

posted @ 2013-11-08 17:05 代码王子 阅读(248) 评论(0) 推荐(0)

hadoop 部署和调优

摘要: 一、集群安装 1.在所有的机器上建立相同的用户名,如:hadoop。 $adduser hadoop $passwd hadoop 2.在/etc/hosts中添加机器名和IP hadoop... 阅读全文

posted @ 2013-11-08 17:04 代码王子 阅读(275) 评论(0) 推荐(0)

上一页 1 ··· 75 76 77 78 79 80 81 82 83 ··· 119 下一页

导航