随笔分类 -  machine learning

摘要:在使用caffe时,我们希望使用自己的数据进行训练,以下给出如何制作自己的数据。所有的数据制作都是基于imagenet的。1.数据准备,我们需要一个train和valid文件夹,一个train.txt和val.txt(图片文件夹的位置可以任意,但是这两个txt文件的位置在data/mydata/目录... 阅读全文
posted @ 2015-03-16 11:24 Tao Kong 阅读(13258) 评论(2) 推荐(0)
摘要:1. 安装cuda 一定按照官方教材,官方教材地址:2. 安装blas 别弄那些mlk之类的东西,直接在命令行直接安装就好。3. 运行caffe时要在主目录下进行,否则会有莫名的错误比如:(a)./create_mnist.sh: 16: ./create_mnist.sh: build/examp... 阅读全文
posted @ 2015-03-16 10:59 Tao Kong 阅读(8388) 评论(1) 推荐(1)
摘要:#作为python新手,可能学习的东西比较多,注意如果两个矩阵相乘的话,跟matlab区别还是挺大的#!/usr/bin/env python# coding=utf-8#格式一般用import ss as dimport theano.tensor as Tfrom theano import f... 阅读全文
posted @ 2015-01-17 19:53 Tao Kong 阅读(514) 评论(0) 推荐(0)
摘要:其实早该整理一下PCA了,怎奈一直没有时间,可能是自己对时间没有把握好吧,下面进入正题。降维的概念所谓降维,就是降低数据的维数。在机器学习中尤其常见,之前做过对一幅图片提取小波特征,对于一幅大小为800*600的图片,如果每个点提取五个尺度、八个方向的特征,那么每一个像素点提取40个特征,那么一副图... 阅读全文
posted @ 2014-12-05 22:45 Tao Kong 阅读(2056) 评论(0) 推荐(0)
摘要:每次提到贝叶斯这三个字,心中的仰慕之情油然而生。感觉贝叶斯推断是众多机器学习算法的基础(尤其是统计学习)。一个很简单的公式应用到非常复杂和广泛的领域,真是一件了不起的事情。贝叶斯公式再讲贝叶斯公式之前,首先回顾一下概率的知识。若 A、B 是两个事件,我们用P(A)表示事件A发生的概率,P(B)表示事... 阅读全文
posted @ 2014-11-25 23:49 Tao Kong 阅读(2439) 评论(0) 推荐(1)
摘要:高斯判别分析(Gaussian discriminative analysis )是一个较为直观的模型,基本的假设是我们得到的数据是独立同分布的(IID),虽然在实际中这种假设很难达到,但有时候拥有了好的假设可以得到较好的结果。在Andrew Ng大神的CS229 Lecture notes中有... 阅读全文
posted @ 2014-11-23 20:51 Tao Kong 阅读(3254) 评论(0) 推荐(0)
摘要:说实在的这篇文章一发出来就遭到很多同行的鄙视,具体可以见Science上的评论,作为小菜,我还是保持沉默,好好学习为好。今天终于挤出时间来写这篇文章,闲话少说,直接上干货吧。聚类是根据距离来进行的,关于距离也可以用一篇很长的文章来叙述,但是这篇文章不是关注这个方面,我们只关注有了距离dij以后,怎么... 阅读全文
posted @ 2014-10-19 10:27 Tao Kong 阅读(3777) 评论(1) 推荐(0)
摘要:以下笔记均为个人整理,学习和交流用。1.机器学习笔记一——梯度下降和最小二乘法2.机器学习笔记二——为什么选择最小二乘 阅读全文
posted @ 2013-12-23 21:38 Tao Kong 阅读(202) 评论(0) 推荐(0)