摘要:所谓图像风格迁移,是指利用算法学习著名画作的风格,然后再把这种风格应用到另外一张图片上的技术。著名的图像处理应用Prisma是利用风格迁移技术,普通用户的照片自动变换为具有艺术家风格的图片。 一、图像风格迁移的原理 1、原始图像风格迁移的原理 在学习原始的图像风格迁移之前,可以在先看看ImageNe 阅读全文
posted @ 2019-12-04 23:19 |旧市拾荒| 阅读 (223) 评论 (0) 编辑
摘要:一、MTCNN的原理 搭建人脸识别系统的第一步是人脸检测,也就是在图片中找到人脸的位置。在这个过程中,系统的输入是一张可能含有人脸的图片,输出是人脸位置的矩形框,如下图所示。一般来说,人脸检测应该可以正确检测出图片中存在的所有人脸,不能用遗漏,也不能有错检。 获得包含人脸的矩形框后,第二步要做的就是 阅读全文
posted @ 2019-11-25 22:07 |旧市拾荒| 阅读 (444) 评论 (0) 编辑
摘要:一、Fast R-CNN原理 在SPPNet中,实际上特征提取和区域分类两个步骤还是分离的。只是使用ROI池化层提取了每个区域的特征,在对这些区域分类时,还是使用传统的SVM作为分类器。Fast R-CNN相比SPPNet更进一步,不再使用SVM作为分类器,而是使用神经网络进行分类,这样就可以同时训 阅读全文
posted @ 2019-11-18 22:12 |旧市拾荒| 阅读 (33) 评论 (0) 编辑
摘要:最近两天被windows下pytorch的安装给搞得很烦了,不过在今天终于安装成功了,如下图所示 下面详细说下此次安装的详细记录吧。我的电脑环境是Windows10+cuda9.0+cudnn7.1。 首先按照流程百度安装教程,然后发现大部分都是用官网https://pytorch.org/提供的命 阅读全文
posted @ 2019-11-14 14:45 |旧市拾荒| 阅读 (37) 评论 (0) 编辑
摘要:一、R-CNN的原理 R-CNN的全称是Region-CNN,它可以说是第一个将深度学习应用到目标检测上的算法。后面将要学习的Fast R-CNN、Faster R-CNN全部都是建立在R-CNN基础上的。 传统的目标检测方法大多以图像识别为基础。一般可以在图片上使用穷举法选出所有物体可能出现的区域 阅读全文
posted @ 2019-11-11 22:38 |旧市拾荒| 阅读 (23) 评论 (0) 编辑
摘要:一、数据准备 首先要做一些数据准备方面的工作:一是把数据集切分为训练集和验证集, 二是转换为tfrecord 格式。在data_prepare/文件夹中提供了会用到的数据集和代码。首先要将自己的数据集切分为训练集和验证集,训练集用于训练模型, 验证集用来验证模型的准确率。这篇文章已经提供了一个实验用 阅读全文
posted @ 2019-11-02 17:34 |旧市拾荒| 阅读 (180) 评论 (0) 编辑
摘要:基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别(文本检测:CTPN,文本识别:DenseNet + CTC),在使用自己的数据训练这个模型的过程中,出现如下错误,由于问题已经解决,当时的出现的问题又没有截图保存,错误又不好复现,所以只能在网上找一张截图下来。 经过查找相关资 阅读全文
posted @ 2019-10-30 16:49 |旧市拾荒| 阅读 (106) 评论 (0) 编辑
摘要:在Tensorflow下使用SSD模型训练自己的数据集时,经过查找很多博客资料,已经成功训练出来了自己的模型,但就是在测试自己模型效果的时候,出现了如下错误。 在查找资料的过程中,出现了很多波折,百度上基本没有同样的错误, 最开始使用的代码是: 尝试过很多种方法,比如下面这种方法,改了后还是报同样的 阅读全文
posted @ 2019-10-27 17:38 |旧市拾荒| 阅读 (293) 评论 (0) 编辑
摘要:在自己的数据集上训练一个新的深度学习模型时,一般采取在预训练好的模型上进行微调的方法。什么是微调?这里已VGG16为例进行讲解,下面贴出VGGNet结构示意图。 上面圈出来的是VGG16示意图,也可以用如下两个图表示。 如上图所示 ,VGG16的结构为卷积+全连接层。卷积层分为5个部分共13层,即图 阅读全文
posted @ 2019-10-25 23:00 |旧市拾荒| 阅读 (69) 评论 (0) 编辑
摘要:一、tensorflow读取机制图解 首先需要思考的一个问题是,什么是数据读取?以图像数据为例,读取的过程可以用下图来表示 假设我们的硬盘中有一个图片数据集0001.jpg,0002.jpg,0003.jpg……我们只需要把它们读取到内存中,然后提供给GPU或是CPU进行计算就可以了。这听起来很容易 阅读全文
posted @ 2019-10-18 22:43 |旧市拾荒| 阅读 (36) 评论 (0) 编辑
摘要:这次我们将建立一个卷积神经网络,它可以把MNIST手写字符的识别准确率提升到99%,读者可能需要一些卷积神经网络的基础知识才能更好的理解本节的内容。 程序的开头是导入TensorFlow: 接下来载入MNIST数据集,并建立占位符。占位符x的含义为训练图像,y_为对应训练图像的标签。 运行后会在当前 阅读全文
posted @ 2019-10-13 21:47 |旧市拾荒| 阅读 (181) 评论 (0) 编辑
摘要:在学习深度学习等知识之前,首先得了解著名的框架TensorFlow里面的一些基础知识,下面首先看一下这个框架的一些基本用法。 得到的结果是: 通过上面可以看出,只是简单的一个矩阵的乘法,我们就写了这么多的代码,看起来比较麻烦,但是没有办法,要用这个框架就必须按照它的用法去用,但是在用这个框架来写深度 阅读全文
posted @ 2019-10-07 21:54 |旧市拾荒| 阅读 (156) 评论 (0) 编辑
摘要:最近,在使用labelImg.exe这款软件进行数据标注的时候,发现在使用过程中软件打不开,一打开出现如下界面然后就立即闪退出去。 最开始解决的方案是使用管理员方式打开,发现还是闪退,最后把电脑重启一下发现还是没有任何效果。 最终解决方案:时隔一天后,在百度中看到,可能的原因是软件的安装的路径中包含 阅读全文
posted @ 2019-09-30 09:32 |旧市拾荒| 阅读 (46) 评论 (0) 编辑
摘要:一、任务 这次我们将了解在机器学习中支持向量机的使用方法以及一些参数的调整。支持向量机的基本原理就是将低维不可分问题转换为高维可分问题,在前面的博客具体介绍过了,这里就不再介绍了。 首先导入相关标准库: 作为一个例子,首先我们随机生成一些数据,考虑分类任务的简单情况,其中两个类别的点是良好分隔的: 阅读全文
posted @ 2019-09-28 22:04 |旧市拾荒| 阅读 (285) 评论 (0) 编辑
摘要:五、SVM求解实例 上面其实已经得出最终的表达式了,下面我们会根据一些具体的点来求解α的值。数据:3个点,其中正例 X1(3,3) ,X2(4,3) ,负例X3(1,1) 如下图所示 我们需要求解下式的极小值 注意约束条件(在这里不要忘记了yi代表的是数据的类别,+1代表正例,-1代表负例) 代入数 阅读全文
posted @ 2019-09-16 11:34 |旧市拾荒| 阅读 (157) 评论 (0) 编辑