随笔分类 - 计算机视觉
摘要:
目标检测 RCNN、SPP、Fast RCNN、Faster RCNN、R-FCN
阅读全文
目标检测 RCNN、SPP、Fast RCNN、Faster RCNN、R-FCN
阅读全文
摘要:1. 传统的方法 1.1 相似检索(特征提取,相似度计算) 技术框架: 算法结构: 目标:实现基于人类颜色感知的相似排序 主要模块:颜色特征提出;特征相似度计算 1.1.1 颜色、纹理、形状 a. 相似颜色检索 统计RGB图像中颜色,形成直方图,转化为向量。这种固定维度直方图维度太高,可以用自编码器
阅读全文
摘要:图片分类,判断图片中是否有某个物体,一个图对应一个标签。性能指标:(1) Top1 error 第一次是否猜中,(2) Top5 error 猜5次其中有一次猜中。 很多出色的网络结构是从大赛中流行起来的。ImageNet Large Scale Visual Recognition Challen
阅读全文
摘要:不问anaconda是什么,只问anaconda里有什么。anaconda 里有python、numpy等科学计算库,可以方便安装 pytorch、tensorflow等深度学习库,可以创建虚拟环境。
阅读全文
摘要:
1. 选择合适的目标函数 均方误差: \(\sum\limits_{i=1}^n (y_i-\hat{y}_i)^2=0\),如神经网络里目标函数 \(J(\mathrm{w})={1\over 2}\sum\limits_{k=1}^c (t_k-z_k)^2\) 交叉熵: \(-\sum\lim
阅读全文
1. 选择合适的目标函数 均方误差: \(\sum\limits_{i=1}^n (y_i-\hat{y}_i)^2=0\),如神经网络里目标函数 \(J(\mathrm{w})={1\over 2}\sum\limits_{k=1}^c (t_k-z_k)^2\) 交叉熵: \(-\sum\lim
阅读全文
摘要:典型的机器学习一般思路:预处理、特征提取、特征选择、推理预测或者识别。深度学习能够尽可能地使用算法解决预处理、特征提取、特征选择。 传统机器学习里,拿什么作为特征对学习影响比较大。特征多增加计算量,如果选择对学习目标有干扰的特征会干扰学习效果。需要人的经验来选择特征。深度学习可以用算法去解决。 深度
阅读全文
摘要:
1 神经网络 大量结构简单的、功能接近的神经元节点按一定体系架构连接成的模拟大脑结构的网状结构。用于分类、模式识别、连续值预测。建立输入与输出的映射关系. 1.1 神经元 生物神经元之间相互连接,传递信息。树突进行输入,细胞体处理,轴突进行输出到下一神经元。 人工神经元包含:输入$x$(考虑权重$w
阅读全文
1 神经网络 大量结构简单的、功能接近的神经元节点按一定体系架构连接成的模拟大脑结构的网状结构。用于分类、模式识别、连续值预测。建立输入与输出的映射关系. 1.1 神经元 生物神经元之间相互连接,传递信息。树突进行输入,细胞体处理,轴突进行输出到下一神经元。 人工神经元包含:输入$x$(考虑权重$w
阅读全文
摘要:1. 图像分割 传统的方法根据灰度、颜色、纹理、形状等特征划分。深度学习是基于语义划分。基于灰度值的两个基本特性,不连续性和相似性(区域内)。 使用场景有前景背景分割等。 1.1 阈值、边缘 阈值法 每个像素与阈值比较,分成大于阈值和小于阈值的两部分。阈值用大津(日本人)法寻找。在灰度统计直方图上找
阅读全文
摘要:1. 颜色特征 1.1 量化颜色直方图 对HSV颜色空间使用统计 bin 进行划分。用 bin 中心代表颜色,统计 bin 上的像素数量。bin 均匀的划分。缺点可能在少量的 bin 上有某个颜色的数量比较多。整体比较稀疏。 1.2 聚类颜色直方图 对颜色进行聚类。由聚类中心代表 bin。不会列出所
阅读全文
摘要:1. 图像的显示与存储原理 1.1 颜色空间 RGB颜色空间 加法混色,越叠加越亮(白) 3个通道 RGB,一个图片数据有3维,长宽和通道,立方体色彩空间 一个像素的颜色值 (b,g,r) 取值范围 [0, 255], 归一化后 [0.0, 1.0] CMY(K) 颜色空间 减法混色,越叠加越黑 4
阅读全文

浙公网安备 33010602011771号