摘要: 参考 ubuntu16.04+gtx1060+cuda8.0+caffe安装、测试经历 ,细节处有差异。 首先说明,这是在台式机上的安装测试经历,首先安装的win10,然后安装ubuntu16.04双系统,显卡为GTX1060 台式机显示器接的是GTX1060 HDMI口,win10上首先安装了最新 阅读全文
posted @ 2017-04-26 16:44 xuanyuyt 阅读(764) 评论(3) 推荐(0) 编辑
摘要: Dlib是一个机器学习的C++库,包含了许多机器学习常用的算法, 而且文档和例子都非常详细。 安装有点类似于opencv,这里我从官网下载dlib-18.17到D盘 1. cmake转VS工程 这里使用cmake-3.6.1-win64-x64 + VS2013 点击configure,选择 Vis 阅读全文
posted @ 2017-03-09 20:52 xuanyuyt 阅读(684) 评论(0) 推荐(0) 编辑
摘要: 通过前面集成学习的介绍我们知道,欲得到泛化性能强的集成学习器,集成中个体学习器应尽量相互独立;虽然“独立”在现实任务中无法做到,但可以设法使基学习器尽可能具有较大差异。 1. Bagging 自助采样(bootstrap sampling): 给定包含$m$个样本的数据集,我们有放回地取$m$次放入 阅读全文
posted @ 2017-02-22 13:53 xuanyuyt 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 操作系统: Python版本: pip版本: 源文件: 1. 安装Caffe需要的依赖包: 将caffe-fast-rcnn/python目录下的requirements下的依赖都装一遍: 这里有一个小技巧,因为pip这个工具对应的网络非常的烂,这个时候,可以将其改为国内的镜像网站,速度将提升几个数 阅读全文
posted @ 2017-02-20 17:02 xuanyuyt 阅读(1182) 评论(0) 推荐(0) 编辑
摘要: 使用工具 :VS2013 + OpenCV 3.1 数据集:minst 训练数据:60000张 测试数据:10000张 输出模型:HOG_SVM_DATA.xml 数据准备 train-images-idx3-ubyte.gz: training set images (9912422 bytes) 阅读全文
posted @ 2017-02-16 15:29 xuanyuyt 阅读(3500) 评论(0) 推荐(0) 编辑
摘要: 项目来源于 《opencv 3计算机视觉 python语言实现》 整个执行过程如下: 1)获取一个训练数据集。 2)创建BOW训练器并获得视觉词汇。 3)采用词汇训练SVM。 4)尝试对测试图像的图像金字塔采用滑动宽口进行检测。 5)对重叠的矩形使用非极大抑制。 6)输出结果。 该项目的结构如下: 阅读全文
posted @ 2017-02-14 21:36 xuanyuyt 阅读(5765) 评论(10) 推荐(0) 编辑
摘要: 1. 神经网络 首先引入一些便于稍后讨论的新标记: $L$:代表神经网络层数$S_l$:代表第$l$层处理单元的个数$K$:代表多分类中类别种数 2. 前向传播(forward propagation) 以上图为例: 令$\textbf{z}^{(2)} = \Theta^{(1)}\textbf{ 阅读全文
posted @ 2017-02-11 20:00 xuanyuyt 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 1. 基本形式 给定由$d$个属性描述的示例 $\textbf{x} =(x_1;x_2;...,x_n)$,其中$x_i$是$x$在第$i$个属性上的取值,线性模型(linear model)试图学习一个通过属性的线性组合来进行预测的函数,即 $f(\textbf{x}) = \theta_0+\ 阅读全文
posted @ 2017-02-11 15:00 xuanyuyt 阅读(281) 评论(0) 推荐(0) 编辑
摘要: 1. 在算法设计中使用策略(Strategy)模式 策略设计模式的目标是将算法封装在类中。因此,可以更容易地替换一个现有的算法,或者组合使用多个算法以拥有更复杂的处理逻辑。此外,该模式将算法的复杂度隐藏在易用的编程接口背后,降低了算法的部署难度。 准备工作 比方说,我们需要构建一个简单的算法,它可以 阅读全文
posted @ 2017-01-11 15:15 xuanyuyt 阅读(807) 评论(0) 推荐(0) 编辑
摘要: 1. 引言 从根本上来说,一张图像是一个由数值组成的矩阵。这也是opencv中使用 cv::Mat 这个数据结构来表示图像的原因。矩阵的每一个元素代表一个像素。对于灰度图像(单通道)而言,像素由8位无符号数来表示,其中0代表黑色,255代表白色。对于彩色图像(BGR三通道)而言,每个像素需要三个这样 阅读全文
posted @ 2017-01-02 16:55 xuanyuyt 阅读(1267) 评论(0) 推荐(0) 编辑