上一页 1 ··· 14 15 16 17 18 19 20 21 22 ··· 34 下一页

2012年7月7日

摘要: 本文可以认为是http://blog.csdn.net/v_JULY_v/article/details/6279498的读后感,我是按照我理解的语言重新表述了一下而已。 海量数据处理的常用方法包括一下几种: 1.分而治之/hash映射 + hash统计 + 堆/快速/归并排序;2.双层桶划分3.Bloom filter/Bitmap;4.Trie树/数据库/倒排索引;5.外排序;6.分布式处理之... 阅读全文
posted @ 2012-07-07 17:36 做个不善的人 阅读(1099) 评论(0) 推荐(0)
 

2012年7月6日

摘要: Challeng分为两种,有用的和无用的。 阅读全文
posted @ 2012-07-06 07:58 做个不善的人 阅读(322) 评论(0) 推荐(0)
 
摘要: 你知道你在主动工作还是被动工作吗? 很多人的回答可能是:“我在主动工作”,为什么呢?也许你说的对,也许错。我下面说说我的看法。 现在的普遍现象是大家都在加班,有的是被老板强逼加班,有的是半主动加班,还有的是主动加班。这里说的主动加班并不是说自己要求加班就是主动加班,我这里想说的更多是工作内容的区别。好吧,不小心扯到了加班上,其实加班也就是工作,工作也就是加班。我只是想说,也许有的人认为我“主动”加... 阅读全文
posted @ 2012-07-06 07:57 做个不善的人 阅读(5262) 评论(0) 推荐(0)
 

2012年7月1日

摘要: 题目:输入一个数组和一个数字,在数组中查找两个数,使得它们的和正好是输入的那个数字。要求时间复杂度是O(n)。如果有多对数字的和等于输入的数字,输出任意一对即可。例如输入数组1、2、4、7、11、15和数字15。由于4+11=15,因此输出4和11。 题目:一个整数数列,元素取值可能是1~N(N是一个较大的正整数)中的任意一个数,相同数值不会重复出现。设计一个算法,找出数列中符合条件的数对的个数,满足数对中两数的和等于N+1。复杂度最好是O(n),如果是O(n2)则不得分。 题目:Given a set S of n integers, are there elements a, b, c i 阅读全文
posted @ 2012-07-01 14:22 做个不善的人 阅读(336) 评论(0) 推荐(0)
 
摘要: 原题: 怎样从顶部开始逐层打印二叉树结点数据? 分析:逐层打印是个很明显的广度优先算法,BFS的首选自然是用队列保存没有被遍历过的节点,每一层查一个marker以区分不同的层,算法复杂度是每个节点被遍历一次,所以为O(n),空间复杂度为某一层的最大节点数。为O(lg(n))。 原题: 怎样把二叉树按zig-zag的顺序转换为一个链表? 分析:这个是类似的,不过就用栈了,计算复杂度为O(n),空间复杂度为O(log(n))。voidprintTreeByLevel(BinaryTreeNode*root){stack<BinaryTreeNode*>nodes_0;stack< 阅读全文
posted @ 2012-07-01 13:23 做个不善的人 阅读(1588) 评论(0) 推荐(0)
 

2012年6月28日

摘要: 在C和C++语言中,声明数组时[]是放在标识符的后面的,比如下面的方式: int a[10]; char b[3]={‘a’,’b’,’c’}; 下面是不合法的: float c[n]; 因为C中不支持动态数组,而C++支持,动态数组的声明方式如下: float *d = new float[m]; 但下面的方式是不合法的: float d[] = new float[m]; 在C#中声明数组... 阅读全文
posted @ 2012-06-28 14:32 做个不善的人 阅读(176) 评论(0) 推荐(0)
 

2012年6月24日

摘要: Memory barrier, is a type of barrier and a class of instruction which causes a CPU or compiler to enforce an ordering constraint on memory operations issued before and after the barrier instruction. ... 阅读全文
posted @ 2012-06-24 15:29 做个不善的人 阅读(3661) 评论(0) 推荐(0)
 

2012年6月22日

摘要: Trie树Trie,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。Trie有3个基本性质:根节点不包含字符,除根节点外每一个节... 阅读全文
posted @ 2012-06-22 15:53 做个不善的人 阅读(1802) 评论(2) 推荐(1)
 
摘要: 堆排序 基于比较的排序,由于不管之前的输入是否有序,都需要建堆、维护堆,所以复杂度总是O(nlgn),不具有稳定性。 冒泡排序 基于比较的排序,时间复杂度为O(n2)。优点是具有稳定性,原来在前面的还在前面。 插入排序 最好情况是输入就是按照升序排列,需要n-1次比较;最坏情况就是输入按照降序排列,需要进行n(n-1)/2次比较。平均时间复杂度是O(n2)。因此非常不适合大数据量的排序。 ... 阅读全文
posted @ 2012-06-22 15:31 做个不善的人 阅读(238) 评论(0) 推荐(0)
 

2012年6月17日

摘要: binary tree & BST 二叉树是比较常见的树,可用于实现BST,二叉堆或二叉排序树。下面是两个基本概念: (1)完全二叉树——若设二叉树的高度为h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第 h 层有叶子节点,并且叶子节点都是从左到右依次排布,这就是完全二叉树。 (2)满二叉树——除了叶结点外每一个结点都有左右子叶且叶结点都处在最底层的二叉树。 二叉查找树(Binary Search Tree),或者是一棵空树,或者是具有下列性质的二叉树: 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值;若它的右子树不空,则右子树上所有结点的值均大于 阅读全文
posted @ 2012-06-17 21:44 做个不善的人 阅读(729) 评论(0) 推荐(0)
 
上一页 1 ··· 14 15 16 17 18 19 20 21 22 ··· 34 下一页