Fork me on GitHub
摘要:源自数学和生物学的机器学习理论,借助计算机的强大运算能力,不断改造我们的工程实践。作为一名专注于图像处理和机器视觉的程序员,在初步理解机器学习相关概念的基础上,我更关注1)现在已经存在了哪些工具;2)如何利用这些工具来解决现实问题。 这里主要研究实现MLP和CNNs。设计到的工具为Opencv和专门用来解决CNNs问题的代码,数据集是Mnist。 阅读全文
posted @ 2015-03-01 11:08 jsxyhelu 阅读(1981) 评论(2) 推荐(0) 编辑
摘要:集装箱体本身的特征有三,一是图片中的需要识别的文字比较大;二是需要识别的文字色彩鲜艳;三是文字周围的干扰比较多,所以直接识别,即使是使用finereader这种软件都无法完成。 所以,第一步需要做的就是更换图片区域,强调联通。比如这样的结果 再强化 这个时候即使是识别成这样,都无法ocr,因为细节太 阅读全文
posted @ 2015-01-24 19:28 jsxyhelu 阅读(670) 评论(0) 推荐(2) 编辑
摘要:​目前,安防行业正从网络化向智能化升级;从简单的视频获取、图像截获向内容分析、自动跟踪进化。借助监控摄像头,进行图像识别或机器视觉设计的需求,变得越来越强烈。这里分享一些自己的研究。 阅读全文
posted @ 2015-01-24 19:22 jsxyhelu 阅读(5367) 评论(0) 推荐(5) 编辑
摘要:​人脸识别是非常经典的机器识别运用,目前已经在许多地方得到了使用。相关的算法原理和实现发展的都很发达,Opencv中就有不错的实现。这是现状。 但是,也正因为此,和人相关的隐私变得令人关注。应用sigvc上面的一个概念叫做“反人脸识别”http://www.sigvc.org/bbs/forum.php?mod=viewthread&tid=3348&highlight=%B7%B4%C8%CB%C1%B3,就是关注用户隐私的一种技术实现。从技术实现上来说,主要分为“人脸识别”和“脸部模糊”两个部分。两个部分的实现难度都不大,关键是“处理输入图片,保护用户隐私”的思路很关键。这里是我的相关研究。 阅读全文
posted @ 2015-01-21 21:00 jsxyhelu 阅读(5295) 评论(6) 推荐(12) 编辑
摘要:这是一个典型的“机器视觉”应用。其中,答题卡的样式可以是由自己来设置的,图片的获取方式提到了可以是“手机拍照、相机拍照”这种比较方便的方式;本例的一个特殊的要求是:你可以识别不出来,但是你不能识别错误,这是项目的特殊要求。这里是我的思考和实现。 阅读全文
posted @ 2015-01-18 14:07 jsxyhelu 阅读(30704) 评论(25) 推荐(30) 编辑
摘要:单向信息传输系统设计实现 阅读全文
posted @ 2015-01-18 07:25 jsxyhelu 阅读(2394) 评论(1) 推荐(1) 编辑
摘要:opencv透视变换 实现透视变换 目标: 在这篇教程中你将学到: 1、如何进行透视变化 2、如何生存透视变换矩阵 理论: 什么是透视变换: 1、透视变换(Perspective Transformation)是将图片投影到一个新的视平面(Viewing Plane),也称作投影映射(Project 阅读全文
posted @ 2015-01-12 20:06 jsxyhelu 阅读(9697) 评论(2) 推荐(2) 编辑
摘要:完成一个机器视觉的项目,首先需要开发者能够理解图像、剖析出特征、提出初步的思路。 阅读全文
posted @ 2015-01-11 15:01 jsxyhelu 阅读(1404) 评论(1) 推荐(3) 编辑
摘要:一、设定bin的初始位置:比如我的电脑 D:\安装程序\opencv\build\x86\vc10\bin H:\生产力工具\opencv\build\x86\vc10\binD:\安装程序\opencv\build\include H:\生产力工具\opencv\build\include H:\ 阅读全文
posted @ 2014-11-28 17:21 jsxyhelu 阅读(568) 评论(0) 推荐(0) 编辑
摘要:ocr是一个宽泛的概念。市场上面ocr将一直是一个不断发展、需求强烈的方向。 我认为,从难度上区分,中文ocr难于英文ocr;手写ocr难于印刷ocr。所以两两组合,中文手写体最难(比如毛体,有一些人都识别不了);而英文(数字)印刷体ocr最简单,对于最简单的东西,我认为就可以直接使用tessera 阅读全文
posted @ 2014-11-27 14:22 jsxyhelu 阅读(656) 评论(0) 推荐(0) 编辑
摘要:最近扒拉了一些光线补偿算法的实现,可能是能力比较有限,看到的大多是是基于Face detection in color images是这篇论文的实现。从效果上来看,的确起到了明亮、美白的效果。但是从代码本身来看,最终的结果只是分别对各通道进行一个有控制的伸展。只不过这个伸展的弹性是“自适应”的,这里 阅读全文
posted @ 2014-10-27 13:44 jsxyhelu 阅读(5092) 评论(3) 推荐(0) 编辑
摘要:在http://www.cnblogs.com/Imageshop/archive/2011/11/13/2247614.html 一文中,作者给出了“自动对比度”的实现方法,非常nice 实际实现过程中,我发现文中有 “Dim HistRed(255)”这样的定义。一般来说,通道是0-255一个2 阅读全文
posted @ 2014-10-26 12:47 jsxyhelu 阅读(2318) 评论(1) 推荐(0) 编辑
摘要:使用csharp 编写winform程序,不仅速度快,而且容易界面美化并找到其他类库的支持;而使用 opencv编写图形图像处理程序,是目前比较流行,而且高效的一种方法。如果需要将两者结合,需要解决的问题就是使用 csharp调用vc 下编写的库文件。两个难点,一个是平台调用的内存控制问题,一个是参 阅读全文
posted @ 2014-09-14 19:54 jsxyhelu 阅读(1646) 评论(0) 推荐(0) 编辑
摘要:在图像识别的方法中,模版识别是比较简单的一种,《学习opencv》中给出了例子和实现代码,即使是在最新版本中,改变的也并不大。 但是这并不代表模版识别在实际应用中不适合。恰恰相反,每一张方法都需要用在它合适的地方。模版识别相对来说,应用于特征不是非常明显,或者对速度要求不是非常高的情况下。当然,有许 阅读全文
posted @ 2014-08-31 14:41 jsxyhelu 阅读(741) 评论(0) 推荐(0) 编辑
摘要:做图像有一段时间了,几个问题进行反思,欢迎讨论 1、机器视觉的本质是什么? 我认为就是通过计算机和数学的方法,对一定形式存储的2d或3d的视觉信号进行增强、延伸,以增加信号的强度; 2、机器视觉的第一原则是什么? 在能够容忍的速度下完成任务。视觉信号的第一原则是“成功率” 3、它的知识结构是怎样的? 阅读全文
posted @ 2014-08-31 12:42 jsxyhelu 阅读(620) 评论(0) 推荐(0) 编辑