随笔分类 -  人工智能

摘要:本文主要对比了两篇重要的参考文献与自己实现的一种图像细节增强技术的实际处理效果,同时简要叙述了笔者算法思路。 图像的细节增强有很多典型的应用,例如暴风影音的左眼功能能让图像看起来更清晰一点。笔者通过实际测试发现,暴风使用的可能是简单的锐化加上图像的对比度饱和度等调节功能,因为对于视频后处理不太可能采用很复杂的算法。图像处理的很多算法都可以直接用于视频后处理,但是,有一个前提:就是算法不能太复杂,否则实时性不太可能满足。 笔者开发的这种细节增强技术也许比暴风的左眼增强更好。具体对比结果如下:1. 去模糊效应 去模糊是图像处理的经典课题,其本质是盲反卷积问题。我并不打算描述去... 阅读全文
posted @ 2013-08-09 16:37 celerychen 阅读(5121) 评论(3) 推荐(1)
摘要:本文主要记录自己在学习稀疏表示在人脸识别中的应用所遇到的问题作一简单的总结。1. 问题背景 信号的稀疏表示并不是新的东西。我们很早就一直在利用这一特性。例如,最简单的JPEG图像压缩算法。原始的图像信号经过DCT变换之后,只有极少数元素是非零的,而大部分元素都等于零或者说接近于零。这就是信号的稀疏性。 任何模型都有建模的假设条件。压缩感知,正是利用的信号的稀疏性这个假设。对于我们处理的信号,时域上本身就具有稀疏性的信号是很少的。但是,我们总能找到某种变换,使得在某个变换域之后信号具有稀疏性。这种变换是很多的,最常见的就是DCT变换,小波变换,gabor变换等。 然而,这种正交... 阅读全文
posted @ 2013-07-06 13:53 celerychen 阅读(2970) 评论(1) 推荐(1)
摘要:深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第六篇,简要描述深度神经网络模型。1. 自联想神经网络与深度网络 自联想神经网络是很古老的神经网络模型,简单的说,它就是三层BP网络,只不过它的输出等于输入。很多时候我们并不要求输出精确的等于输入,而是允许一定的误差存在。所以,我们说,输出是对输入的一种重构。其网络结构可以很简单的表示如下: 如果我们在上述网络中不使用sigmoid函数,而使用线性函数,这就是PCA模型。中间网络节... 阅读全文
posted @ 2013-06-12 17:40 celerychen 阅读(778) 评论(0) 推荐(0)
摘要:深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第五篇,谈谈PCA模型。本来PCA模型与深度学习是没有任何联系的。通常我们只是用PCA来对机器学习的数据做预处理。本来想详细记录一下PCA的原理,但网上已经有一篇不错的文章,链接如下:http://hi.baidu.com/ifengzh/item/8851b6387aebefc4382ffa60本文前面部分内容引用了这篇文章的内容。一、简介 PCA(Principal Components Analysis)即主成分分析,是图像处理中经常用到.. 阅读全文
posted @ 2013-06-07 15:29 celerychen 阅读(599) 评论(0) 推荐(0)
摘要:深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第四篇,谈谈我对逻辑回归和softmax回归的一点理解。网络上对逻辑回归和softmax回归论述也很多,包括各种不同语言的代码,都可以下载到。1. 逻辑回归源于线性回归模型。 线性回归问题的自变量是连续变量,而逻辑回归问题的自变量一般是取值为离散的名义变量,例如,男,女。逻辑回归是对因变量和自变量之前发生关系的概率解释。例如,某种疾病的发生与抽烟的关系,这种关系可以解释为抽烟会导致这种疾病发生的概率值。当逻辑回归用于分类的时候,分类器的阈值点就是. 阅读全文
posted @ 2013-06-03 17:15 celerychen 阅读(1664) 评论(0) 推荐(0)
摘要:深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第三篇,谈谈自己对最近几年颇为流行的受限波尔兹曼网络RBM的理解。我不打算详细描述其生物学运行机理和相关的算法推导过程,因为网络上已经有太多的教程可以参考。1. 概述 前面描述的神经网络模型是一种确定的结构。而波尔兹曼网络是一种随机网络。如何来描述一个随机网络呢?很多书上有大量的篇幅介绍其原理。这里把它总结为以下两点。 第一,概率分布函数。由于网络节点的取值状态是随机的,从贝叶斯网的观点来看,要描述整个网络,需要用三种概率分布来描述系... 阅读全文
posted @ 2013-05-28 14:30 celerychen 阅读(411) 评论(0) 推荐(0)
摘要:深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第二篇,讲讲经典的卷积神经网络。我不打算详细描述卷积神经网络的生物学运行机理,因为网络上有太多的教程可以参考。这里,主要描述其数学上的计算过程,也就是如何自己编程去实现的问题。1. 概述 回想一下BP神经网络。BP网络每一层节点是一个线性的一维排列状态,层与层的网络节点之间是全连接的。这样设想一下,如果BP网络中层与层之间的节点连接不再是全连接,而是局部连接的。这样,就是一种最简单的一维卷积网络。如果我们把上述这个思路扩展到二维,这就是我们在... 阅读全文
posted @ 2013-05-25 13:42 celerychen 阅读(404) 评论(1) 推荐(0)
摘要:深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第一篇,从最经典的BP网络开始。我不打算详细描述神经网络的生物学运行机理,因为网络上有太多的教程可以参考。这里,主要描述其数学上的计算过程,并且采用的符号可能与其它参考书上的符号有很大差异。特别是,斯坦福官方网站上对深度网络中所引用的符号有太多的小标,上标,给初学者带来不便。一. 网络结构经典的BP网络,其具体结构如下: 请特别注意上面这个图的一些符号说明如下:二. 学习算法 1. 信号的前向传递过程 请特别注意上述公式中的下... 阅读全文
posted @ 2013-05-23 13:08 celerychen 阅读(427) 评论(0) 推荐(0)