摘要: Bag-of-wordBag-of-words模型是信息检索领域常用的文档表示方法。在信息检索中,BOW模型假定对于一个文档,忽略它的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词的出现都是独立的,不依赖于其它单词是否出现。例如有如下两个文档:1:Boblikestopl... 阅读全文
posted @ 2014-12-17 16:38 oudan 阅读(3410) 评论(0) 推荐(0) 编辑
摘要: matlab code,对应论文:Unsupervised Discovery of Mid-Level Discriminative PatchesSaurabh Singh, Abhinav Gupta, and Alexei A. Efros]其中VisualEntityDetectors:是... 阅读全文
posted @ 2014-12-12 16:57 oudan 阅读(639) 评论(0) 推荐(1) 编辑
摘要: 首先要先清楚最大流的含义,就是说从源点到经过的所有路径的最终到达汇点的所有流量和EK算法的核心反复寻找源点s到汇点t之间的增广路径,若有,找出增广路径上每一段[容量-流量]的最小值delta,若无,则结束。在寻找增广路径时,可以用BFS来找,并且更新残留网络的值(涉及到反向边)。而找到delta后,... 阅读全文
posted @ 2014-11-07 10:14 oudan 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 0) 引论正如名字所言,最短路径算法就是为了找到一个图中,某一个点到其他点的最短路径或者是距离。最短路径算法一般分为四种情况:a) 无权重的最短路径b) 有权重的最短路径c) 边的权重为负的图d) 无圈的图ps:上面的情况针对的都是有向图。1)无权重的最短路径下图是一个例子:假设我们取点v3作为初始... 阅读全文
posted @ 2014-11-06 11:26 oudan 阅读(1791) 评论(0) 推荐(0) 编辑
摘要: 从算法的实现向算法的设计转变,提供解决问题的思路1.贪心算法一种局部最优算法设计思路,思想是保证每一步选择在当前达到最优。一个很常见的贪心算法案例是零钱找取问题。调度问题:书上的调度问题比较简单,其目标是所有作业的平均持续时间(调度+运行)最短,无论是但处理器还是多处理器,最优解的方案总是按作业的长... 阅读全文
posted @ 2014-11-04 15:53 oudan 阅读(1299) 评论(0) 推荐(0) 编辑
摘要: 基本介绍一个集合S,集合中一个元素a。a的等价类是S的一个子集,该子集包含所有与a有关系的元素。等价类形成是对S的一个划分且S中的每一个成员恰好出现在一个等价类中。这样,判断a与b是否有关系,只需要判断a与b是否在一个等价类中即可。对于集合S划分,取任意两个等价类,Si与Sj,如果Si∩Sj = ∅... 阅读全文
posted @ 2014-11-03 22:06 oudan 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 一 外部排序的基本思路假设有一个72KB的文件,其中存储了18K个整数,磁盘中物理块的大小为4KB,将文件分成18组,每组刚好4KB。首先通过18次内部排序,把18组数据排好序,得到初始的18个归并段R1~R18,每个归并段有1024个整数。然后对这18个归并段使用4路平衡归并排序:第1次归并:产生... 阅读全文
posted @ 2014-11-03 15:32 oudan 阅读(1025) 评论(0) 推荐(0) 编辑
摘要: 好久没有写博客了,这一段时间主要在准备为将来找工作复习,今天我就总结一下关于如何查找数组的前K个最小值实现方法,查找前K个最小值实现方法很多,主要的思想包括如下的几种: 1、对数组进行排序,然后前K个元素就是需要查找的元素,排序的方法可以采用快速排序,但是我们知道在快速排序中如果已经是有序的数组,采... 阅读全文
posted @ 2014-11-03 13:03 oudan 阅读(741) 评论(0) 推荐(0) 编辑
摘要: 出自数据结构与算法分析第二版(C)一 引论二 算法分析三 表 栈 队列四 树五 散列六 优先队列七 排序优先队列实现事件模拟:http://maozj.iteye.com/blog/676567d堆 左式堆 斜堆:http://blog.csdn.net/yangtrees/article/deta... 阅读全文
posted @ 2014-10-31 14:20 oudan 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 引论左堆的合并,插入,删除最小的时间复杂度为O(logN)。二项队列就是为了对这些结果进一步提高的一种数据结构。利用二项队列,这三种操作的最坏时间复杂度为O(logN),但是插入的平均时间复杂度为O(1)二项队列二项队列不是一棵树,它是一个森林,由一组堆序的树组成的深林,叫做二项队列。二项队列有几个... 阅读全文
posted @ 2014-10-31 14:18 oudan 阅读(466) 评论(0) 推荐(0) 编辑