上一页 1 ··· 54 55 56 57 58 59 60 61 62 ··· 119 下一页

2013年12月5日

mahout系列----Dirichlet 分布

摘要: Dirichlet分布可以看做是分布之上的分布。如何理解这句话,我们可以先举个例子:假设我们有一个骰子,其有六面,分别为{1,2,3,4,5,6}。现在我们做了10000次投掷的实验,得到的实验结果是六面分别出现了{2000,2000,2000,2000,1000,1000}次,如果用每一面出现的... 阅读全文

posted @ 2013-12-05 09:47 代码王子 阅读(258) 评论(0) 推荐(0)

mahout系列----minhash聚类

摘要: Map: Vector featureVector = features.get(); if (featureVector.size() > 24); bytesToHash[1] = (byte) (value >> 16); bytesToH... 阅读全文

posted @ 2013-12-05 00:25 代码王子 阅读(219) 评论(0) 推荐(0)

mahout系列之---谱聚类

摘要: 1.构造亲和矩阵W 2.构造度矩阵D 3.拉普拉斯矩阵L 4.计算L矩阵的第二小特征值(谱)对应的特征向量Fiedler 向量 5.以Fiedler向量作为kmean聚类的初始中心,用kmeans聚类 亲和矩阵 :W_ij=exp(-(d(s_i,s_j)/2o^2)) ... 阅读全文

posted @ 2013-12-05 00:05 代码王子 阅读(215) 评论(0) 推荐(0)

2013年12月4日

jvm内存查看与分析工具

摘要: 2.3 JVM的垃圾收集策略 GC的执行时要耗费一定的CPU资源和时间的,因此在JDK1.2以后,JVM引入了分代收集的策略,其中对新生代采用"Mark-Compact"策略,而对老生代采用了“Mark-Sweep"的策略。其中新生代的垃圾收集器命名为“minor gc”,老生代的GC命名... 阅读全文

posted @ 2013-12-04 16:10 代码王子 阅读(170) 评论(0) 推荐(0)

JVM内存模型及垃圾收集策略解析

摘要: JVM内存模型是Java的核心技术之一,之前51CTO曾为大家介绍过JVM分代垃圾回收策略的基础概念,现在很多编程语言都引入了类似Java JVM的内存模型和垃圾收集器的机制,下面我们将主要针对Java中的JVM内存模型及垃圾收集的具体策略进行综合的分析。 一 JVM内存模型 1.1 Java栈... 阅读全文

posted @ 2013-12-04 16:07 代码王子 阅读(140) 评论(0) 推荐(0)

CopyOnWriteArrayList

摘要: 除了加锁外,其实还有一种方式可以防止并发修改异常,这就是将读写分离技术(不是数据库上的)。 先回顾一下一个常识: 1、JAVA中“=”操作只是将引用和某个对象关联,假如同时有一个线程将引用指向另外一个对象,一个线程获取这个引用指向的对象,那么他们之间不会发生ConcurrentModific... 阅读全文

posted @ 2013-12-04 15:29 代码王子 阅读(176) 评论(0) 推荐(0)

Herriot

摘要: Herriot测试框架是Hadoop-0.21.0及以后版本中新加入的测试框架,它的出现主要是为了尽可能地模拟真实的大规模分布式系统,并且对该系统实现自动化测试。和Hadoop以前的测试框架MiniDFSCluster类似,Herriot也采用了JUnit框架,此外,Herriot还引入了面向切... 阅读全文

posted @ 2013-12-04 01:31 代码王子 阅读(296) 评论(0) 推荐(0)

Prefix tree

摘要: Prefix tree The trie, or prefix tree, is a data structure for storing strings or other sequences in a way that allows for a fast look-up. In its sim... 阅读全文

posted @ 2013-12-04 01:10 代码王子 阅读(259) 评论(0) 推荐(0)

hadoop 测试框架

摘要: hadoop 0.21以前的版本中(这里拿0.20为例,其他版本可能有少许不同),所有的测试相关代码都是放置在${HADOOP_HOME}/src/test下,在该目录下,是按照不同的目录来区分针对不同模块的测试代码。这里需要了解的是:对于相应的hadoop代码和class的包结构,在test中... 阅读全文

posted @ 2013-12-04 01:01 代码王子 阅读(639) 评论(0) 推荐(0)

Hadoop RPC

摘要: hadoop rpc机制 && 将avro引入hadoop rpc机制初探 1 RPC RPC(Remote Procedure Call)——远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。 2 hadoop.ipc 2.1 Server RPC Se... 阅读全文

posted @ 2013-12-04 00:52 代码王子 阅读(143) 评论(0) 推荐(0)

上一页 1 ··· 54 55 56 57 58 59 60 61 62 ··· 119 下一页

导航