摘要: 插队的时候,我喂过猪、也放过牛。假如没有人来管,这两种动物也完全知道该怎样生活。它们会自由自在地闲逛,饥则食渴则饮,春天来临时还要谈谈爱情;这样一来,它们的生活层次很低,完全乏善可陈。人来了以后,给它们的生活做出了安排:每一头牛和每一口猪的生活都有了主题。就它们中的大多数而言,这种生活主题是很悲惨的 阅读全文
posted @ 2016-10-21 20:29 刘岩-- 阅读(317) 评论(0) 推荐(1) 编辑
摘要: 本文申明:本系列文章为本人原创,如有转载请注明文章原地址。 今天我们机器学习老师在说到周志华老师的《机器学习》这本书的时候,p60页讲到了LDA,但是其中的公式推导省略了很多,现在我来补充一下。 一:LDA的思想 给定两个数据集一个是XX一个是OO,然后我们把XXOO投影到一条直线上,但是啊,这个人 阅读全文
posted @ 2016-10-21 19:23 刘岩-- 阅读(1915) 评论(0) 推荐(1) 编辑
摘要: 现在终于开始看论文了,机器学习基础部分的更新可能以后会慢一点了,当然还是那句话宁愿慢点,也做自己原创的,自己思考的东西。现在开辟一个新的模块----多视图学习相关论文笔记,就是分享大牛的paper,然后写出自己的反思,希望大家多多交流。 现在来说说周志华老师的opmv算法。 一摘要:多视图学习已经成为机器学习非常重要的组成部分,很多得到的效果都比单视图学习要好的多,但是这些方法经常被用在小的和低维... 阅读全文
posted @ 2016-10-20 19:31 刘岩-- 阅读(1159) 评论(0) 推荐(0) 编辑
摘要: 前情提要:关于logistic regression,其实本来这章我是不想说的,但是刚看到岭回归了,我感觉还是有必要来说一下。 一:最小二乘法 最小二乘法的基本思想:基于均方误差最小化来进行模型求解的方法。在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧氏距离之和最小。就是说让你 阅读全文
posted @ 2016-10-13 13:57 刘岩-- 阅读(7241) 评论(2) 推荐(1) 编辑
摘要: 大家好久不见,实战部分一直托更,很不好意思。本文实验数据与代码来自机器学习实战这本书,倾删。 还是一样,设置两个数组,前两个作为特征值,后一个作为标签。当然这是简单的处理,实际开发中特征值都是让我们自己选的,所以有时候对业务逻辑的理解还是很重要的。 这段代码见一面1.4节。 Alpha表示步长,ma 阅读全文
posted @ 2016-10-07 21:04 刘岩-- 阅读(1858) 评论(0) 推荐(0) 编辑
摘要: 本文申明:本文原创,如转载请注明原文出处。 引言:上一篇我们讲到了logistic回归,今天我们来说一说与其很相似的svm算法,当然问题的讨论还是在线性可分的基础下讨论的。 很多人说svm是目前最好的分类器,那我们就来看看我们的svm好在哪里。 一:初识svm 问题:用一条直线把下图的圆球和五角星分 阅读全文
posted @ 2016-10-06 18:40 刘岩-- 阅读(11985) 评论(0) 推荐(2) 编辑
摘要: 本文申明:本系列笔记全部为原创内容,如有转载请申明原地址出处。谢谢 序言:what is logistic regression? Logistics 一词表示adj.逻辑的;[军]后勤学的n.[逻]数理逻辑;符号逻辑;[军]后勤学, “回归”是由英国著名生物学家兼统计学家高尔顿在研究人类遗传问题时 阅读全文
posted @ 2016-09-25 20:52 刘岩-- 阅读(952) 评论(0) 推荐(0) 编辑
摘要: 场景: 有时候我们对大量数据进行处理,对性能要求很高,而且数据都是定长的,比如对移动信息登记表进行处理:名字 身份证信息 手机号码 这些都是定长的,今天小花来教大家如何对此类数据进行处理。 步骤一: 指定要读取的数据文件。 步骤二: 定义数据要读取的方式。 步骤三: 执行读取文件并根据格式把每行数据 阅读全文
posted @ 2016-09-19 09:58 刘岩-- 阅读(2156) 评论(1) 推荐(0) 编辑
摘要: excel中后缀为csv和xls,二者区别如下:1、xls 文件就是Microsoft excel电子表格的文件格式。2、csv是最通用的一种文件格式,它可以非常容易地被导入各种PC表格及数据库中。 此文件,一行即为数据表的一行。生成数据表字段用半角逗号隔开。csv是文本文件,用记事本就能打开,XL 阅读全文
posted @ 2016-09-19 09:05 刘岩-- 阅读(26722) 评论(0) 推荐(0) 编辑
摘要: 从CS中导入数据 Python中有一个CSV模块支持读写各种方言格式的CSV文件。方言是很重要的,因为没有一个同意的CSV标准,不同的应用实现CSV的方式略有不同,当看到文件的内容的时候你往往很容易第辨认出文件使用的是哪种方言。 步骤一: 首先导入CSV 模块 步骤二: 然后用with 语句打开数据文件并把它绑定到对象f(with 不用担心操作资源后会关闭数据源,因为with语句的上下文管理器会帮... 阅读全文
posted @ 2016-09-18 22:19 刘岩-- 阅读(2732) 评论(0) 推荐(0) 编辑