随笔分类 - 机器学习
Image Pyramid
摘要:今天我们介绍图像处理邻域中比较常用的一种方法,image pyramid, 也叫图像金字塔。就是将图像进行一层一层的下采样,图像金字塔是为了构建图像的多尺度,让模型能够更好的适应图像的尺度变化,图像金字塔可以广泛应用于图像识别,目标检测,还有光流配准,块匹配都能看到它...
阅读全文
机器学习:YOLO for Object Detection (二)
摘要:之前介绍了 YOLO-v1 单纯的利用一个卷积网络完成了目标检测,不过 YOLO-v1 虽然速度很快,但是比起其他的网络比如 Fast R-CNN 检测的准确率还是差不少,所以作者又提出了改良版的 YOLO-v2, 作者也明确说了,YOLO-v2 也是借鉴了其他网络的...
阅读全文
机器学习:YOLO for Object Detection (一)
摘要:最近看了基于CNN的目标检测另外两篇文章,YOLO v1 和 YOLO v2,与之前的 R-CNN, Fast R-CNN 和 Faster R-CNN 不同,YOLO 将目标检测这个问题重新回到了基于回归的模型。YOLO v1 是一个很简单的 CNN 网络,YOLO...
阅读全文
机器学习: R-CNN, Fast R-CNN and Faster R-CNN
摘要:做语义分割的大概都知道这几篇文章了,将一个传统的计算机视觉模型,用CNN一点一点的替换,直到最后构建了一个完整的基于CNN的端到端的模型。这几篇文章有一定的连贯性。从中可以看到一种研究的趋势走向。上一篇文章里介绍过,Selective Search for Objec...
阅读全文
机器学习:Selective Search for Object Recognition
摘要:今天介绍 IJCV 2013 年的一篇文章,Selective Search for Object Recognition,这个是后面著名的DL架构 R-CNN 的基础,后续介绍 R-CNN 的时候,会发现 R-CNN 和这篇文章里介绍的算法非常类似。做模式识别的人都...
阅读全文
机器学习:simple linear iterative clustering (SLIC) 算法
摘要:图像分割是图像处理,计算机视觉领域里非常基础,非常重要的一个应用。今天介绍一种高效的分割算法,即 simple linear iterative clustering (SLIC) 算法,顾名思义,这是一种简单的迭代聚类算法,这个算法发表于 2012 年的 PAMI ...
阅读全文
机器学习: Logistic Regression--python
摘要:今天介绍 logistic regression,虽然里面有 regression 这个词,但是这其实是一种分类的方法,这个分类方法输出的也是 0-1 之间的一个数,可以看成是一种概率输出,这个分类器利用一种 BP 迭代和随机梯度下降的方法来训练求得参数和建立分类模型...
阅读全文
机器学习:朴素贝叶斯--python
摘要:今天介绍机器学习中一种基于概率的常见的分类方法,朴素贝叶斯,之前介绍的KNN, decision tree 等方法是一种 hard decision,因为这些分类器的输出只有0 或者 1,朴素贝叶斯方法输出的是某一类的概率,其取值范围在 0-1 之间,朴素贝叶斯在做文...
阅读全文
机器学习:决策树--python
摘要:今天,我们介绍机器学习里比较常用的一种分类算法,决策树。决策树是对人类认知识别的一种模拟,给你一堆看似杂乱无章的数据,如何用尽可能少的特征,对这些数据进行有效的分类。决策树借助了一种层级分类的概念,每一次都选择一个区分性最好的特征进行分类,对于可以直接给出标签 lab...
阅读全文
机器学习:Colorization using Optimization
摘要:今天介绍 Siggraph 2004 年的一篇文章: Colorization using Optimization,利用优化的方法对灰度图像进行着色,这里用到了非常经典的泊松方程以及稀疏矩阵的线性优化。简单来说,就是对一张灰度图像先人为地进行着色,然后利用优化的方法...
阅读全文
天池历届大赛答辩PPT及视频
摘要:1、阿里移动推荐算法: 答辩视频:https://space.dingtalk.com/c/gQHOEnXdXw 2、资金流入流出预测: 答辩视频:https://space.dingtalk.com/c/gQHOEnXi6w 3、阿里移动推荐&资金流入流出预测答辩P...
阅读全文
机器学习: KNN--python
摘要:今天介绍机器学习中比较常见的一种分类算法,K-NN,NN 就是 Nearest Neighbors, 也就是最近邻的意思,这是一种有监督的分类算法,给定一个 test sample, 计算这个 test sample 与 training set 里每个 train...
阅读全文
Tensorflow学习笔记——张量、图、常量、变量(一)
摘要:1 张量和图TensorFlow是一种采用数据流图(data flow graphs),用于数值计算的开源软件库。其中 Tensor 代表传递的数据为张量(多维数组),Flow 代表使用计算图进行运算。数据流图用「结点」(nodes)和「边」(edges)组成的有向图...
阅读全文
感知机算法的几点总结
摘要:y语句让他家户户 任天野还让1. 感知机函数: f(x)=sign(w⋅x+b) 其实,sign是符号函数,w是权重,w·x是内积,b是偏置,...
阅读全文
偏差(bias)和方差(variance)及其与K折交叉验证的关系
摘要:先上图:泛化误差可表示为偏差、方差和噪声之和偏差(bias):学习算法的期望预测与真实结果(train set)的偏离程度(平均预测值与真实值之差),刻画算法本身的拟合能力;方差(variance):使用同规模的不同训练集进行训练时带来的性能变化(预测值与平均预测值之...
阅读全文
Scikit-learn库中的数据预处理:独热编码(二)
摘要:在上一篇博客中介绍了数值型数据的预处理但是真实世界的数据集通常都含有分类型变量(categorical value)的特征。当我们讨论分类型数据时,我们不区分其取值是否有序。比如T恤尺寸是有序的,因为XL>L>M。而T恤颜色是无序的。在讲解处理分类数据的技巧之前,我们...
阅读全文
Scikit-learn库中的数据预处理(一)
摘要:数据标准化:当单个特征的样本取值相差甚大或明显不遵从高斯正态分布时,标准化表现的效果较差。实际操作中,经常忽略特征数据的分布形状,移除每个特征均值,划分离散特征的标准差,从而等级化,进而实现数据中心化。一、标准化(Standardization),或者去除均值和方差进...
阅读全文
逻辑回归模型及其代价函数推导
摘要:1. 逻辑回归逻辑回归,该模型的输出变量范围始终在0和1之间。 逻辑回归模型的假设是:g 代表逻辑函数(logistic function)是一个常用的逻辑函数为S形函数 (Sigmoid function),公式为:,该函数的图像为:合起来,我们得到逻辑回归模型的假...
阅读全文
正则化线性回归
摘要:1. 模型的欠拟合、过拟合无论是回归问题还是分类问题都可能存在模型的欠拟合和过拟合的情况。下图是回归问题中的例子:第一个模型欠拟合,第二个模型刚好拟合,第三个过拟合。下图是分类问题中的例子:第一个模型欠拟合,第二个模型刚刚好,第三个模型过拟合。对于过拟合问题,我们通常...
阅读全文
单变量线性回归中的梯度下降法求解代价函数的最小值
摘要:1. 什么是代价函数在线性回归中我们有一个像这样的训练集,m代表了训练样本的数量,比如 m = 47。而我们的假设函数, 也就是用来进行预测的函数,是这样的线性函数形式,则代价函数可以表示为:我们绘制一个等高线图,三个坐标分别为θ0 和θ1 和 J(θ0,θ1):则可...
阅读全文