2017年5月14日
该文被密码保护。 阅读全文
posted @ 2017-05-14 20:34 鸣凤山 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 在搭建flume集群收集日志写入hdfs时发生了下面的错误: java.lang.NullPointerException: Expected timestamp in the Flume event headers, but it was null at com.google.common.bas 阅读全文
posted @ 2017-05-14 20:10 鸣凤山 阅读(1339) 评论(0) 推荐(0) 编辑
摘要: Java NIO(New IO)是一个可以替代标准Java IO API的IO API(从Java 1.4开始),Java NIO提供了与标准IO不同的IO工作方式。 Java NIO: Channels and Buffers(通道和缓冲区) 标准的IO基于字节流和字符流进行操作的,而NIO是基于 阅读全文
posted @ 2017-05-14 19:51 鸣凤山 阅读(102) 评论(0) 推荐(0) 编辑
  2017年5月13日
摘要: Gaussian Mixture Model (GMM)。事实上,GMM 和 k-means 很像,不过 GMM 是学习出一些概率密度函数来(所以 GMM 除了用在 clustering 上之外,还经常被用于 density estimation ),简单地说,k-means 的结果是每个数据点被 阅读全文
posted @ 2017-05-13 14:58 鸣凤山 阅读(1184) 评论(0) 推荐(0) 编辑
摘要: 一、概念 与传统的聚类算法(比如K-means)不同,Canopy聚类最大的特点是不需要事先指定k值(即clustering的个数),因此具有很大的实际应用价值。与其他聚类算法相比,Canopy聚类虽然精度较低,但其在速度上有很大优势,因此可以使用Canopy聚类先对数据进行“粗”聚类,得到k值后再 阅读全文
posted @ 2017-05-13 12:59 鸣凤山 阅读(354) 评论(0) 推荐(0) 编辑
  2017年5月12日
摘要: 贝叶斯法则 贝叶斯法则(Bayes'theorem/Bayes theorem/Bayesian law) 什么是贝叶斯法则 贝叶斯的统计学中有一个基本的工具叫贝叶斯法则、也称为贝叶斯公式, 尽管它是一个数学公式,但其原理毋需数字也可明了。如果你看到一个人总是做一些好事,则那个人多半会是一个好人。这 阅读全文
posted @ 2017-05-12 13:58 鸣凤山 阅读(291) 评论(0) 推荐(0) 编辑
  2017年5月10日
摘要: R CMD BATCH 和 Rscript 使用前都要先添加环境变量 把 C:\Program Files\R\R-3.3.0\bin; 加到"系统变量"的Path 值的最开始 可以用 R CMD BATCH *.r 也可以用 Rscript *.r args0 args1 这个可以跟一定的参数 当 阅读全文
posted @ 2017-05-10 13:56 鸣凤山 阅读(2572) 评论(0) 推荐(0) 编辑