视频理解 - 博客园

2013年11月28日

摘要：转自：http://blog.sina.com.cn/s/blog_ad29a69d0101ausn.html1，CRF++的指南，以及下载英文版官网，使用手册的感觉。http://crfpp.googlecode.com/svn/trunk/doc/index.html下载地址http://code.google.com/p/crfpp/downloads/list2，CRF++-0.58.zip我下载的是CRF++0.58.zip的版本，解压。doc文件夹为官网地址；example为给的4个例子。实际需要的：crf_learn.exe；crf_test.exe；libcrfpp.dll三个阅读全文

posted @ 2013-11-28 15:15 视频理解阅读(1375) 评论(0) 推荐(0)

2013年11月15日

UIUC同学Jia-Bin Huang收集的计算机视觉代码合集

摘要：转自：http://blog.sina.com.cn/s/blog_631a4cc40100wrvz.htmlUIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码，链接如下：https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html这些代码很实用，可以让我们站在巨人的肩膀上~~TopicResourcesReferencesFeature ExtractionSIFT [1] [Demo program][SIFT Library] [VLFeat]PCA-SIFT [2] [Project]Affin 阅读全文

posted @ 2013-11-15 14:43 视频理解阅读(447) 评论(0) 推荐(0)

6 个优秀的开源 OCR 光学字符识别工具

摘要：转自：http://sigvc.org/bbs/thread-870-1-1.html纸张在许多地方已日益失宠，无纸化办公谈论40多年，办公环境正限制纸山的生成。而过去几年，无纸化办公的概念发生了显着的转变。在计算机软件的帮助下，包含大量重要管理数据和资讯的文档可以更方便的以电子形式储存。扫描文档的好处不纯粹是存档理由。为了访问基于纸张的信息和将信息整合进数字工作流，光学字符识别(OCR)技术至关重要。选择正确的OCR工具要基于特定需求而定，例如在线OCR服务对某些人有用，但可能存在隐私问题和文件大小限制。 OCR软件非大众产品，因此开源替代相对于商业级重量级产品相对较少，再加上OCR软件阅读全文

posted @ 2013-11-15 14:38 视频理解阅读(1541) 评论(0) 推荐(1)

2013年9月22日

应用OpenCV进行OCR字符识别

摘要： opencv自带一个字符识别的例子，它的重点不是OCR字符识别，而主要是演示机器学习的应用。它应用的是UCI提供的字符数据（特征数据）。DAMILES在网上发布了一个应用OpenCV进行OCR的例子，http://blog.damiles.com/2008/11/basic-ocr-in-opencv/。这些例子都只能用于学习OpenCV或熟悉OCR的简单流程，因为它们与当前比较专业的OCR引擎的识别率相去甚远。这里写下OpenCV下OCR的流程：1. 特征提取2. 训练3. 识别特征提取1. 在图像预处理后，提取出字符相关的ROI图像，并且大小归一化，整个图像的像素值序列可以直接作为特征。d 阅读全文

posted @ 2013-09-22 22:46 视频理解阅读(2925) 评论(0) 推荐(1)

2013年9月9日

心胸与格局

摘要：人一辈子没有出息，往往是因为朋友太少。如果你的命不好，改变命运的唯一办法是“找命好的人和他交朋友”，跟着他们，你的命就好。一生中选择与谁合作，怎么合作，需要技巧和方法。见高人不交，见高师不拜，人生遗憾也。要想自己命好，最好的办法是找到命好的人，和他交友，加入他从事的事业。同流才能交流，交流才能交心，交心才能交易，交易才会改变命运。人脉就是钱脉，关系就是实力，看一个人的实力，就看他周围的关系。万丈红尘三杯酒，千秋大业一壶茶，这壶茶该和谁喝，这杯酒该让谁喝。跟着领导混，当官是迟早的事情；跟着富翁混，发财是迟早的事情；跟着胖子混，发福是迟早的事情......一辈子明白了这事，你准能发财。你每天在和阅读全文

posted @ 2013-09-09 20:44 视频理解阅读(487) 评论(0) 推荐(0)

2013年8月30日

Software: MPEG-7 Feature Extraction Library

摘要： SoftwareMPEG-7 Feature Extraction Library : This library is adapted from MPEG-7 XM Reference Software to make it work with Open Source Computer Vision library (OpenCV) data structures (e.g., IplImage, Mat). It has a very easy-to-use API. Moreover, existing bugs (resulting in wrong descriptor values) 阅读全文

posted @ 2013-08-30 09:12 视频理解阅读(551) 评论(0) 推荐(0)

2013年8月27日

也谈LBP

摘要： LBP(local banary patter)是一种非常经典的用来描述图像局部纹理特征的算子。1，基本LBPLBP方法自1994年提出，此后就作为一个有效的纹理特征，不断的被人使用和改进。LBP非常简单，也非常有效。左边的图是从一个图片上拿下来的3*3矩阵，矩阵上的值就是像素值，现在我们要计算的中间那个点的LBP。除了它此外的8个点依次与中间点比较，比它(也就是15)大的记成1，比它小的记成0，然后我们就得到右面的图片。然后我们选定一个起始点-这个图片选的是左上角第一个点，然后按照顺时针方向得到一个二进制串10011010，转换为十进制则为154。到此，我们得到了中间点的LBP值--154。阅读全文

posted @ 2013-08-27 16:48 视频理解阅读(408) 评论(0) 推荐(0)

2013年7月31日

3个著名加密算法(MD5、RSA、DES)的解析

摘要： MD5的全称是Message-Digest Algorithm 5，在90年代初由MIT的计算机科学实验室和RSA Data Security Inc发明，经MD2、MD3和MD4发展而来。 MD5将任意长度的“字节串”变换成一个128bit的大整数，并且它是一个不可逆的字符串变换算法，换句话说就是，即使你看到源程序和算法描述，也无法将一个MD5的值变换回原始的字符串，从数学原理上说，是因为原始的字符串有无穷多个，这有点象不存在反函数的数学函数。 MD5的典型应用是对一段Message(字节串)产生fingerprint(指纹)，以防止被“篡改”。举个例子，你将一段话写在一个叫 readme. 阅读全文

posted @ 2013-07-31 19:36 视频理解阅读(714) 评论(0) 推荐(0)

2013年7月24日

深度学习的一些教程

摘要：转自：http://baojie.org/blog/2013/01/27/deep-learning-tutorials/几个不错的深度学习教程，基本都有视频和演讲稿。附两篇综述文章和一副漫画。还有一些以后补充。Jeff Dean 2013 @ Stanfordhttp://i.stanford.edu/infoseminar/dean.pdf一个对DL能干什么的入门级介绍，主要涉及Google在语音识别、图像处理和自然语言处理三个方向上的一些应用。参《Spanner and Deep Learning》（2013-01-19）Hinton 2009A tutorial on Deep Lea 阅读全文

posted @ 2013-07-24 09:49 视频理解阅读(1678) 评论(0) 推荐(0)

2013年7月9日

视频运动motion vector获取。

摘要： http://victor.csie.org/blog/archives/362----------------------------------------------------------------------Motion Vector Extraction June 10Filed under Uncategorized by victor | 1 comment為了做 MULTIMEDIA ANALYSIS AND INDEXING 這門課的 project，我們這組需要從 MPEG video 裡面取出 motion vector（它在 MPEG video 裡的用途是用來做壓阅读全文

posted @ 2013-07-09 16:45 视频理解阅读(1208) 评论(0) 推荐(0)

路漫漫其修远兮

video action recognition