摘要: 转自:http://blog.sina.com.cn/s/blog_ad29a69d0101ausn.html1,CRF++的指南,以及下载英文版官网,使用手册的感觉。http://crfpp.googlecode.com/svn/trunk/doc/index.html下载地址http://code.google.com/p/crfpp/downloads/list2,CRF++-0.58.zip我下载的是CRF++0.58.zip的版本,解压。doc文件夹为官网地址;example为给的4个例子。实际需要的:crf_learn.exe;crf_test.exe;libcrfpp.dll三个 阅读全文
posted @ 2013-11-28 15:15 视频理解 阅读(1359) 评论(0) 推荐(0)
摘要: 转自:http://blog.sina.com.cn/s/blog_631a4cc40100wrvz.htmlUIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下:https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html这些代码很实用,可以让我们站在巨人的肩膀上~~TopicResourcesReferencesFeature ExtractionSIFT [1] [Demo program][SIFT Library] [VLFeat]PCA-SIFT [2] [Project]Affin 阅读全文
posted @ 2013-11-15 14:43 视频理解 阅读(424) 评论(0) 推荐(0)
摘要: 转自:http://sigvc.org/bbs/thread-870-1-1.html纸张在许多地方已日益失宠,无纸化办公谈论40多年,办公环境正限制纸山的生成。而过去几年,无纸化办公的概念发生了显着的转变。在计算机软件的帮助 下,包含大量重要管理数据和资讯的文档可以更方便的以电子形式储存。扫描文档的好处不纯粹是存档理由。为了访问基于纸张的信息和将信息整合进数字工作流, 光学字符识别(OCR)技术至关重要。选择正确的OCR工具要基于特定需求而定,例如在线OCR服务对某些人有用,但可能存在隐私问题和文件大小限制。 OCR软件非大众产品,因此开源替代相对于商业级重量级产品相对较少,再加上OCR软件 阅读全文
posted @ 2013-11-15 14:38 视频理解 阅读(1498) 评论(0) 推荐(1)
摘要: opencv自带一个字符识别的例子,它的重点不是OCR字符识别,而主要是演示机器学习的应用。它应用的是UCI提供的字符数据(特征数据)。DAMILES在网上发布了一个应用OpenCV进行OCR的例子,http://blog.damiles.com/2008/11/basic-ocr-in-opencv/。这些例子都只能用于学习OpenCV或熟悉OCR的简单流程,因为它们与当前比较专业的OCR引擎的识别率相去甚远。这里写下OpenCV下OCR的流程:1. 特征提取2. 训练3. 识别特征提取1. 在图像预处理后,提取出字符相关的ROI图像,并且大小归一化,整个图像的像素值序列可以直接作为特征。d 阅读全文
posted @ 2013-09-22 22:46 视频理解 阅读(2902) 评论(0) 推荐(1)
摘要: 人一辈子没有出息,往往是因为朋友太少。如果你的命不好,改变命运的唯一办法是“找命好的人和他交朋友”,跟着他们,你的命就好。一生中选择与谁合作,怎么合作,需要技巧和方法。见高人不交,见高师不拜,人生遗憾也。要想自己命好,最好的办法是找到命好的人,和他交友,加入他从事的事业。同流才能交流,交流才能交心,交心才能交易,交易才会改变命运。人脉就是钱脉,关系就是实力,看一个人的实力,就看他周围的关系。万丈红尘三杯酒,千秋大业一壶茶,这壶茶该和谁喝,这杯酒 该让谁喝。跟着领导混,当官是迟早的事情;跟着富翁混,发财是迟早的事情;跟着胖子混,发福是迟早的事情......一辈子明白了这事,你准能发财。你每天在和 阅读全文
posted @ 2013-09-09 20:44 视频理解 阅读(480) 评论(0) 推荐(0)
摘要: SoftwareMPEG-7 Feature Extraction Library : This library is adapted from MPEG-7 XM Reference Software to make it work with Open Source Computer Vision library (OpenCV) data structures (e.g., IplImage, Mat). It has a very easy-to-use API. Moreover, existing bugs (resulting in wrong descriptor values) 阅读全文
posted @ 2013-08-30 09:12 视频理解 阅读(527) 评论(0) 推荐(0)
摘要: LBP(local banary patter)是一种非常经典的用来描述图像局部纹理特征的算子。1,基本LBPLBP方法自1994年提出,此后就作为一个有效的纹理特征,不断的被人使用和改进。LBP非常简单,也非常有效。左边的图是从一个图片上拿下来的3*3矩阵,矩阵上的值就是像素值,现在我们要计算的中间那个点的LBP。除了它此外的8个点依次与中间点比较,比它(也就是15)大的记成1,比它小的记成0,然后我们就得到右面的图片。然后我们选定一个起始点-这个图片选的是左上角第一个点,然后按照顺时针方向得到一个二进制串10011010,转换为十进制则为154。到此,我们得到了中间点的LBP值--154。 阅读全文
posted @ 2013-08-27 16:48 视频理解 阅读(376) 评论(0) 推荐(0)
摘要: MD5的全称是Message-Digest Algorithm 5,在90年代初由MIT的计算机科学实验室和RSA Data Security Inc发明,经MD2、MD3和MD4发展而来。 MD5将任意长度的“字节串”变换成一个128bit的大整数,并且它是一个不可逆的字符串变换算法,换句话说就是,即使你看到源程序和算法描述,也无法将一个MD5的值变换回原始的字符串,从数学原理上说,是因为原始的字符串有无穷多个,这有点象不存在反函数的数学函数。 MD5的典型应用是对一段Message(字节串)产生fingerprint(指纹),以防止被“篡改”。举个例子,你将一段话写在一个叫 readme. 阅读全文
posted @ 2013-07-31 19:36 视频理解 阅读(693) 评论(0) 推荐(0)
摘要: 转自:http://baojie.org/blog/2013/01/27/deep-learning-tutorials/几个不错的深度学习教程,基本都有视频和演讲稿。附两篇综述文章和一副漫画。还有一些以后补充。Jeff Dean 2013 @ Stanfordhttp://i.stanford.edu/infoseminar/dean.pdf一个对DL能干什么的入门级介绍,主要涉及Google在语音识别、图像处理和自然语言处理三个方向上的一些应用。参《Spanner and Deep Learning》(2013-01-19)Hinton 2009A tutorial on Deep Lea 阅读全文
posted @ 2013-07-24 09:49 视频理解 阅读(1661) 评论(0) 推荐(0)
摘要: http://victor.csie.org/blog/archives/362----------------------------------------------------------------------Motion Vector Extraction June 10Filed under Uncategorized by victor | 1 comment為了做 MULTIMEDIA ANALYSIS AND INDEXING 這門課的 project,我們這組需要從 MPEG video 裡面取出 motion vector(它在 MPEG video 裡的用途是用來做壓 阅读全文
posted @ 2013-07-09 16:45 视频理解 阅读(1186) 评论(0) 推荐(0)