GJS
少年,奋起吧。
摘要: 1.最大似然估计(MLE): 什么是最大似然估计? 问题:给定一组观察数据还有一个参数待定的模型,如何来估计这个未知参数呢? 观察数据(x1,y1)......(xn,yn) 待定模型参数为θ,模型为f(x;θ)。这时候可以借助观察数据来估计这个θ。这就是最大似然函数估计。 举个例子: ... 阅读全文
posted @ 2014-09-11 17:24 GJS Blog 阅读(2224) 评论(0) 推荐(0)
摘要: JAVA 并发编程 最初计算机是单任务的,然后发展到多任务,接着出现多线程并行,同时计算机也从单cpu进入到多cpu。如下图: 多任务:其实就是利用操作系统时间片轮转使用的原理。操作系统通过将cpu的执行时间分割成多个时间片,为每个任务分配时间片,因为cpu处理速度很快,这样就用户看来好... 阅读全文
posted @ 2014-09-01 21:04 GJS Blog 阅读(18392) 评论(1) 推荐(4)
摘要: Linear Regreesion 在现实生活中普遍存在着变量之间的关系,有确定的和非确定的。确定关系指的是变量之间可以使用函数关系式表示,还有一种是属于非确定的(相关),比如人的身高和体重,一样的身高体重是不一样的。 线性回归: 1: 函数模型(Model): 假设有训练数据 那么为了方便我们写成 阅读全文
posted @ 2014-08-21 21:48 GJS Blog 阅读(84115) 评论(0) 推荐(3)
摘要: HDFS Hadoop的核心就是HDFS与MapReduce。那么HDFS又是基于GFS的设计理念搞出来的。 HDFS全称是Hadoop Distributed System。HDFS是为以流的方式存取大文件而设计的。适用于几百MB,GB以及TB,并写一次读多次的场合。而对于低延时数据访问、大量小文... 阅读全文
posted @ 2014-08-18 11:06 GJS Blog 阅读(2416) 评论(0) 推荐(1)
摘要: 分布式文件系统 分布式文件系统:当数据集的大小超过一台独立物理计算机的存储能力时,就有必要对它进行分区(partition)并存储到若干台单独的计算机上。管理网络中夸多台计算机存储的文件系统。这种系统构架于网络之上,肯定会引入网络编程的复杂性,因此它比普通的磁盘文件系统更为复杂。 我们首先来简单... 阅读全文
posted @ 2014-08-17 22:40 GJS Blog 阅读(4191) 评论(0) 推荐(0)
摘要: 决策树(decision tree) 决策树:是一种基本的分类和回归方法。它是基于实例特征对实例进行分类的过程,我们可以认为决策树就是很多if-then的规则集合。 优点:1)训练生成的模型可读性强,我们可以很直观的看出生成模型的构成已经工作方式,因为模型就是由数据属性和类别构成一棵树。 ... 阅读全文
posted @ 2014-08-12 19:57 GJS Blog 阅读(2117) 评论(4) 推荐(0)
摘要: 面向对象这个东西,其实我们一直是不是都没有感觉到自己在用,以后我一定要用用。以前学c#时候认真的看过一次,最近一直研究java。随便再看看。多态问题: 在java中多态分为(1)编译时多态和(2)运行时多态(1)编译时多态比较容易理解:其实就是通过方法重载,就是方法的重载,同一个函数名但是可以参... 阅读全文
posted @ 2014-08-12 12:32 GJS Blog 阅读(866) 评论(2) 推荐(0)
摘要: 我需要把星期天看的一些东西记录下来,要不然会忘记。hashCode、equals: 1)每个java对象都有hashCode和equals方法。java的终极类是object类,那么object类是如何来标注自己呢,就是object这个类是如何来区分对方。就是使用它们的hashcode和equals... 阅读全文
posted @ 2014-08-11 21:58 GJS Blog 阅读(493) 评论(2) 推荐(0)
摘要: 首先来说明一下bootstraps:可以把它认为是一种有放回的抽样方法。bagging:boostraps aggregating(汇总)boosting:Adaboot (Adaptive Boosting)提升方法提升(boosting):在分类问题中,通过改变训练样本的权重,学习多个分类器,并... 阅读全文
posted @ 2014-08-11 20:37 GJS Blog 阅读(1464) 评论(0) 推荐(1)
摘要: 这个暂时还不太明白,先写一点明白的。EM:最大期望算法,属于基于模型的聚类算法。是对似然函数的进一步应用。我们知道,当我们想要估计某个分布的未知值,可以使用样本结果来进行似然估计,进而求最大似然估计就可以估计出要求的参数。但是有时候还会有未知参数,这样就不能使用极大似然估计。当然这个参数与我们要估计... 阅读全文
posted @ 2014-08-05 15:53 GJS Blog 阅读(250) 评论(0) 推荐(0)