随笔分类 -  【5】TensorFlow

摘要:一、图像分类介绍 什么是图像分类,核心是从给定的分类集合中给图像分配一个标签的任务。实际上,这意味着我们的任务是分析一个输入图像并返回一个将图像分类的标签。标签来自预定义的可能类别集。 示例:我们假定一个可能的类别集categories = {dog, cat, eagle},之后我们提供一张图1给 阅读全文
posted @ 2020-03-11 17:58 |旧市拾荒| 阅读(10192) 评论(0) 推荐(1)
摘要:一、任务介绍 这次的任务是对两百余张图片里面特定的编号进行识别,涉及保密的原因,这里就不能粘贴出具体的图片了,下面粘贴出一张类似需要识别的图片。 假如说我的数据源如上图所示,那么我需要做的工作就是将上面图片里面标红的数字给识别出来。 我采用的算法是https://github.com/YCG09/c 阅读全文
posted @ 2020-02-03 20:53 |旧市拾荒| 阅读(1806) 评论(0) 推荐(1)
摘要:所谓图像风格迁移,是指利用算法学习著名画作的风格,然后再把这种风格应用到另外一张图片上的技术。著名的图像处理应用Prisma是利用风格迁移技术,普通用户的照片自动变换为具有艺术家风格的图片。 一、图像风格迁移的原理 1、原始图像风格迁移的原理 在学习原始的图像风格迁移之前,可以在先看看ImageNe 阅读全文
posted @ 2019-12-04 23:19 |旧市拾荒| 阅读(9402) 评论(0) 推荐(3)
摘要:一、MTCNN的原理 搭建人脸识别系统的第一步是人脸检测,也就是在图片中找到人脸的位置。在这个过程中,系统的输入是一张可能含有人脸的图片,输出是人脸位置的矩形框,如下图所示。一般来说,人脸检测应该可以正确检测出图片中存在的所有人脸,不能用遗漏,也不能有错检。 获得包含人脸的矩形框后,第二步要做的就是 阅读全文
posted @ 2019-11-25 22:07 |旧市拾荒| 阅读(7353) 评论(0) 推荐(1)
摘要:一、Fast R-CNN原理 在SPPNet中,实际上特征提取和区域分类两个步骤还是分离的。只是使用ROI池化层提取了每个区域的特征,在对这些区域分类时,还是使用传统的SVM作为分类器。Fast R-CNN相比SPPNet更进一步,不再使用SVM作为分类器,而是使用神经网络进行分类,这样就可以同时训 阅读全文
posted @ 2019-11-18 22:12 |旧市拾荒| 阅读(895) 评论(0) 推荐(0)
摘要:一、R-CNN的原理 R-CNN的全称是Region-CNN,它可以说是第一个将深度学习应用到目标检测上的算法。后面将要学习的Fast R-CNN、Faster R-CNN全部都是建立在R-CNN基础上的。 传统的目标检测方法大多以图像识别为基础。一般可以在图片上使用穷举法选出所有物体可能出现的区域 阅读全文
posted @ 2019-11-11 22:38 |旧市拾荒| 阅读(728) 评论(0) 推荐(0)
摘要:一、数据准备 首先要做一些数据准备方面的工作:一是把数据集切分为训练集和验证集, 二是转换为tfrecord 格式。在data_prepare/文件夹中提供了会用到的数据集和代码。首先要将自己的数据集切分为训练集和验证集,训练集用于训练模型, 验证集用来验证模型的准确率。这篇文章已经提供了一个实验用 阅读全文
posted @ 2019-11-02 17:34 |旧市拾荒| 阅读(1946) 评论(0) 推荐(1)
摘要:在自己的数据集上训练一个新的深度学习模型时,一般采取在预训练好的模型上进行微调的方法。什么是微调?这里已VGG16为例进行讲解,下面贴出VGGNet结构示意图。 上面圈出来的是VGG16示意图,也可以用如下两个图表示。 如上图所示 ,VGG16的结构为卷积+全连接层。卷积层分为5个部分共13层,即图 阅读全文
posted @ 2019-10-25 23:00 |旧市拾荒| 阅读(21495) 评论(0) 推荐(8)
摘要:一、tensorflow读取机制图解 首先需要思考的一个问题是,什么是数据读取?以图像数据为例,读取的过程可以用下图来表示 假设我们的硬盘中有一个图片数据集0001.jpg,0002.jpg,0003.jpg……我们只需要把它们读取到内存中,然后提供给GPU或是CPU进行计算就可以了。这听起来很容易 阅读全文
posted @ 2019-10-18 22:43 |旧市拾荒| 阅读(353) 评论(0) 推荐(1)
摘要:这次我们将建立一个卷积神经网络,它可以把MNIST手写字符的识别准确率提升到99%,读者可能需要一些卷积神经网络的基础知识才能更好的理解本节的内容。 程序的开头是导入TensorFlow: 接下来载入MNIST数据集,并建立占位符。占位符x的含义为训练图像,y_为对应训练图像的标签。 运行后会在当前 阅读全文
posted @ 2019-10-13 21:47 |旧市拾荒| 阅读(2094) 评论(0) 推荐(1)
摘要:在学习深度学习等知识之前,首先得了解著名的框架TensorFlow里面的一些基础知识,下面首先看一下这个框架的一些基本用法。 得到的结果是: 通过上面可以看出,只是简单的一个矩阵的乘法,我们就写了这么多的代码,看起来比较麻烦,但是没有办法,要用这个框架就必须按照它的用法去用,但是在用这个框架来写深度 阅读全文
posted @ 2019-10-07 21:54 |旧市拾荒| 阅读(690) 评论(0) 推荐(1)
摘要:一、简介 首先介绍MNIST 数据集。如图1-1 所示, MNIST 数据集主要由一些手写数字的图片和相应的标签组成,图片一共有10 类,分别对应从0~9 ,共10 个阿拉伯数字。 原始的MNIST 数据库一共包含下面4 个文件, 见表1-1 。 在表1 - 1 中,图像数据是指很多张手写字符的图像 阅读全文
posted @ 2019-05-05 15:42 |旧市拾荒| 阅读(18548) 评论(0) 推荐(4)
摘要:在前一个博客中,我们已经对MNIST 数据集和TensorFlow 中MNIST 数据集的载入有了基本的了解。本节将真正以TensorFlow 为工具,写一个手写体数字识别程序,使用的机器学习方法是Softmax 回归。 一、Softmax回归的原理 Softmax 回归是一个线性的多类分类模型,实 阅读全文
posted @ 2019-05-05 15:42 |旧市拾荒| 阅读(524) 评论(0) 推荐(0)