GJS
少年,奋起吧。

随笔分类 -  ML

tensorflow-cnn
摘要:需要安装 python,numpy,tensorflow,运行代码即可。 tensorflow很好装,用pip安装即可。 可以参照http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/os_setup.htm安装。数据集:mnis 阅读全文
posted @ 2016-07-25 19:24 GJS Blog 阅读(2425) 评论(0) 推荐(0)
libsvm使用方法总结
摘要:1.所需要软件下载: (1)libsvm(http://www.csie.ntu.edu.tw/~cjlin/libsvm/) (2)python (3)gnuplot 画图软件(ftp://ftp.gnuplot.info/pub/gnuplot/)这里只考虑windows的环境: 1、 下载li... 阅读全文
posted @ 2015-05-06 10:29 GJS Blog 阅读(25040) 评论(2) 推荐(2)
机器学习----分布问题(二元,多元变量分布,Beta,Dir)
摘要:这涉及到数学的概率问题。 二元变量分布: 伯努利分布,就是0-1分布(比如一次抛硬币,正面朝上概率) 那么一次抛硬币的概率分布如下: 假设训练数据如下: 那么根据最大似然估计(MLE),我们要求u: 求值推导过程如下: 所以可以求出: ... 阅读全文
posted @ 2015-05-03 11:04 GJS Blog 阅读(3313) 评论(0) 推荐(1)
机器学习--介绍
摘要:1.机器学习:通过对以往历史数据的学习建立一个模型用来预测以后的数据进行预测和分析。1.1监督学习 supervised learning 监督学习可以分为生成方法(生成模型generative)和判别方法(判别模型discreiminative) 生成模型:学习联合概率分布p(x,y) ... 阅读全文
posted @ 2014-09-22 20:08 GJS Blog 阅读(1812) 评论(6) 推荐(2)
MLE MAP EM
摘要:1.最大似然估计(MLE): 什么是最大似然估计? 问题:给定一组观察数据还有一个参数待定的模型,如何来估计这个未知参数呢? 观察数据(x1,y1)......(xn,yn) 待定模型参数为θ,模型为f(x;θ)。这时候可以借助观察数据来估计这个θ。这就是最大似然函数估计。 举个例子: ... 阅读全文
posted @ 2014-09-11 17:24 GJS Blog 阅读(2219) 评论(0) 推荐(0)
机器学习-----线性回归浅谈(Linear Regression)
摘要:Linear Regreesion 在现实生活中普遍存在着变量之间的关系,有确定的和非确定的。确定关系指的是变量之间可以使用函数关系式表示,还有一种是属于非确定的(相关),比如人的身高和体重,一样的身高体重是不一样的。 线性回归: 1: 函数模型(Model): 假设有训练数据 那么为了方便我们写成 阅读全文
posted @ 2014-08-21 21:48 GJS Blog 阅读(84113) 评论(0) 推荐(3)
决策树介绍
摘要:决策树(decision tree) 决策树:是一种基本的分类和回归方法。它是基于实例特征对实例进行分类的过程,我们可以认为决策树就是很多if-then的规则集合。 优点:1)训练生成的模型可读性强,我们可以很直观的看出生成模型的构成已经工作方式,因为模型就是由数据属性和类别构成一棵树。 ... 阅读全文
posted @ 2014-08-12 19:57 GJS Blog 阅读(2114) 评论(4) 推荐(0)
boosting和bagging
摘要:首先来说明一下bootstraps:可以把它认为是一种有放回的抽样方法。bagging:boostraps aggregating(汇总)boosting:Adaboot (Adaptive Boosting)提升方法提升(boosting):在分类问题中,通过改变训练样本的权重,学习多个分类器,并... 阅读全文
posted @ 2014-08-11 20:37 GJS Blog 阅读(1462) 评论(0) 推荐(1)
EM 算法
摘要:这个暂时还不太明白,先写一点明白的。EM:最大期望算法,属于基于模型的聚类算法。是对似然函数的进一步应用。我们知道,当我们想要估计某个分布的未知值,可以使用样本结果来进行似然估计,进而求最大似然估计就可以估计出要求的参数。但是有时候还会有未知参数,这样就不能使用极大似然估计。当然这个参数与我们要估计... 阅读全文
posted @ 2014-08-05 15:53 GJS Blog 阅读(249) 评论(0) 推荐(0)
SVM 支持向量机
摘要:学习策略:间隔最大化(解凸二次规划的问题) 对于上图,如果采用感知机,可以找到无数条分界线区分正负类,SVM目的就是找到一个margin 最大的 classifier,因此这个分界线(超平面)一定是固定。假设a是正类,b是负类,那么a和b直接的距离就是ob-oa在直线l上的映射。我们假设a,... 阅读全文
posted @ 2014-07-29 21:51 GJS Blog 阅读(675) 评论(0) 推荐(0)
Linear Regreesion
摘要:3、似然函数:我是这么理解的,比如说我们知道某个X的概率分布密度函数,但是这个概率分布有未知的参数,但是我想得到这个未知的参数θ,然后我们就通过很多个已知的变量,把这些概率分布密度函数乘起来,这个就是似然函数。 最大似然函数:知道似然函数后,我们就要求出这个未知参数,我们要求的这个参数应该使得... 阅读全文
posted @ 2014-07-27 15:43 GJS Blog 阅读(401) 评论(0) 推荐(0)