10 2016 档案

摘要:一、随机变量 可以取不同的值,不同的值有不同的概率。 看到随机变量取任何值,都要想到背后有个概率,如果是连续变量,在每一点的概率是0,连续型随机变量通常只考虑概率密度。 机器学习就是通过一堆随机变量预测另一个随机变量,先假设随机变量之间的概率分布,然后从数据中估计分布的参数。 任何概率模型的假设都是 阅读全文
posted @ 2016-10-15 20:33 fionaplanet 阅读(777) 评论(0) 推荐(0)
摘要:一直对于各种分类器评估的指标有点晕,今天决定琢磨下,并且写下来,方便以后回忆。 一、混淆矩阵 来源于信息论,根据上面的混淆矩阵,有3个指标需要搞清楚,我觉得记公式真的很容易搞混,建议大家都直接记文字加上自己理解就好了。 准确率=正确预测正负的个数/总个数(这个指标在python中的交叉验证时可以求准 阅读全文
posted @ 2016-10-06 17:49 fionaplanet 阅读(5429) 评论(0) 推荐(0)
摘要:SVM(Support Vector Machine)有监督的机器学习方法,可以做分类也可以做回归。SVM把分类问题转化为寻找分类平面的问题,并通过最大化分类边界点距离分类平面的距离来实现分类。 有好几个模型,SVM基本,SVM对偶型,软间隔SVM,核方法,前两个有理论价值,后两个有实践价值。下图来 阅读全文
posted @ 2016-10-01 19:15 fionaplanet 阅读(820) 评论(0) 推荐(0)