随笔分类 -  算法设计

数据结构及算法设计
常用 大数据量、海量数据处理 方法 / 算法总结
摘要:(转:来源无从考证)大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论。1.Bloom filter适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集基本原理及要点:对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数组置1,查找时如果 阅读全文

posted @ 2012-02-29 18:08 情非得已swust 阅读(770) 评论(0) 推荐(0)

凸包面积--分治法
摘要:凸包面积Time Limit:1000MSMemory Limit:65535KBSubmissions:381Accepted:112Description麦兜是个淘气的孩子。一天,他在玩钢笔的时候把墨水洒在了白色的墙上。再过一会,麦兜妈就要回来了,麦兜为了不让妈妈知道这件事情,就想用一个白色的凸多边形把墙上的墨点盖住。你能告诉麦兜最小需要面积多大的凸多边形才能把这些墨点盖住吗? 现在,给出了这些墨点的坐标,请帮助麦兜计算出覆盖这些墨点的最小凸多边形的面积。Input多组测试数据。第一行是一个整数T,表明一共有T组测试数据。 每组测试数据的第一行是一个正整数N(0< N < = 阅读全文

posted @ 2011-10-12 21:54 情非得已swust 阅读(4311) 评论(1) 推荐(1)