公告

2011年9月27日

分布式系统领域经典论文翻译集

摘要： from:http://duanple.blog.163.com/blog/static/709717672011330101333271/?utm_source=twitterfeed&utm_medium=twitter分布式领域论文译序sql&nosql年代记SMAQ：海量数据的存储计算和查询一．google论文系列1.google系列论文译序2. The anatomy of a large-scale hypertextual Web search engine3.面向星球的网络搜索：google集群架构4.GFS：google文件系统5.mapreduce: Sim 阅读全文

posted @ 2011-09-27 21:56 weedge 阅读(328) 评论(0) 推荐(0)

b-tree索引和hash索引的区别

摘要： b-tree索引和hash索引的区别昨晚重翻了《深入浅出mysql》再次查看了一下印象模糊的btree索引和hash索引的区别。故此做一下笔记。在mysql中，大多数索引（如 PRIMARY KEY,UNIQUE,INDEX和FULLTEXT）都是在BTREE中存储，但使用memory引擎可以选择BTREE索引或者HASH索引，两种不同类型的索引各自有其不同的使用范围。=========以下节选网摘==========Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的阅读全文

posted @ 2011-09-27 21:52 weedge 阅读(575) 评论(0) 推荐(0)

Vim大全

摘要： Vim大全详细讲解：http://coolshell.cn/articles/5426.html读本文之前请注意：1. 本文的目标是提供一些vim的使用技巧，利用这些技巧可以提高vim的操作效率。部分技巧在vi上也可以使用，但是现在基本上都是用vim了。2. 本文是整理和总结使用技巧，而非讲解vim入门，因此不会涉及最基本的使用，例如如何上移或下移光标，对此类操作请参阅任何一本vim或者vi教程。3. 本文阅读对象是了解了vim的基本操作，而希望高效地利用vim进行工作的人。熟练使用vim的人自然不必细读，如果能留下您的宝贵意见，本人将感激不尽。4. 本文由本人搜集整理，转载请注明出处本文一般阅读全文

posted @ 2011-09-27 21:48 weedge 阅读(332) 评论(0) 推荐(0)

十大数据挖掘算法及各自优势

摘要：十大数据挖掘算法及各自优势From:http://www.sphinxsearch.org/archives/367国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法：C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.不仅仅是选中的十大算法，其实参加评选的18种算法，实际上随便拿出一种来都可以称得上是经典算法，它们在数据挖掘领域都产生了极为深远的影响。1. 阅读全文

posted @ 2011-09-27 21:45 weedge 阅读(259) 评论(0) 推荐(0)

2011年9月26日

百度试题

摘要： 1、请实现两棵树是否相等的比较，相等返回，否则返回其他值，并说明算法复杂度。数据结构为：typedef struct_TreeNode{char c;TreeNode *leftchild;TreeNode *rightchild;}TreeNode;函数接口为：int CompTree(TreeNode* tree1,TreeNode* tree2);注：A、B两棵树相等当且仅当Root->c==RootB-->c,而且A和B的左右子树相等或者左右互换相等。2、写一段程序，找出数组中第k大小的数，输出数所在的位置。例如{2，4，3，4，7}中，第一大的数是7，位置在4。第二大、第阅读全文

posted @ 2011-09-26 22:56 weedge 阅读(363) 评论(0) 推荐(0)

二叉树遍历

摘要：二叉树的深度优先遍历、广度优先遍历和非递归遍历二叉树的遍历：D：访问根结点，L：遍历根结点的左子树，R：遍历根结点的右子树。给定一棵二叉树的前序遍历序列和中序遍历序列可以惟一确定一棵二叉树。二叉树的深度优先遍历的非递归的通用做法是采用栈，广度优先遍历的非递归的通用做法是采用队列。深度优先遍历二叉树。1. 中序遍历（LDR）的递归算法：若二叉树为空，则算法结束；否则：中序遍历根结点的左子树；访问根结点；中序遍历根结点的右子树。2. 前序遍历（DLR）的递归算法：若二叉树为空，则算法结束，否则：访问根结点；前序遍历根结点的左子树；前序遍历根结点的右子树。3. 后序遍历（LRD）的递归算阅读全文

posted @ 2011-09-26 22:45 weedge 阅读(341) 评论(0) 推荐(0)

2011年9月17日

C++的static用法

摘要： C++的static有两种用法：面向过程程序设计中的static和面向对象程序设计中的static。前者应用于普通变量和函数，不涉及类；后者主要说明static在类中的作用。一、面向过程设计中的static1、静态全局变量在全局变量前，加上关键字static，该变量就被定义成为一个静态全局变量。我们先举一个静态全局变量的例子，如下：//Example 1 #include <iostream.h> void fn(); static int n; //定义静态全局变量 void main() { n=20; cout<<n<<endl; fn(); } vo 阅读全文

posted @ 2011-09-17 15:30 weedge 阅读(203) 评论(0) 推荐(0)

2011年9月12日

关于链表结构的基本操作 c 实现 (创建，插入删除，反转，合并链表，查找，是否有环，链表相交情况)

摘要：最近一直为找工作的事困扰着，技术面中问的题中数据结构相关的链表操作就占了一半左右，所以好好补习下链表的操作，并用相关代码实现，有错误的地方，希望读者能够指出，非常感谢~！链表是最基本的数据结构，按结构分为：单链表，循环单链表，双链表，循环双链表。实际应用中单链表是应用最多的情况，也是最基本结构，学好这个简单的结构，才能更好的掌握复杂的数据结构。而按存储结构分为：顺序存储和链式存储。现在给出单链表的链式存储结构的实现：代码如下：(c 实现接口，c++测试)头文件：（LinkList.h）/*==================================================.. 阅读全文

posted @ 2011-09-12 23:37 weedge 阅读(725) 评论(0) 推荐(0)

2011年8月30日

倒排索引压缩(无损压缩)

摘要： Index Compression(压缩比vs解压效率)主要是对倒排索引(inverted index)中的倒排列表(postings list)进行编码压缩。编码方法：1.D-gaps:对有序编号(如docid)进行差值(d-gaps)编码。（处理小数据需要小代码量，处理时间短）编码并没有定义存储数据的比特模式，所以他自身不节省任何空间。2.Elias-γ Code结合了一元编码和二进制编码。编码数字k需要计算两个值： 3. Elias-δCode通过改变kd的编码方式，将kd分解为Kdd使用一元编码，kdr用二进制编码， kr仍然用二进制编码4. Variable Byte Code.. 阅读全文

posted @ 2011-08-30 10:25 weedge 阅读(1221) 评论(0) 推荐(0)

2011年8月29日

B-tree的代码实现 - c / c++ 版本

摘要：看到一篇相关的好文章，引用下：http://www.cnblogs.com/leoo2sk/archive/2011/07/10/mysql-index.html。相当滴不错，备忘下。在这篇文章中http://blog.csdn.net/weege/article/details/6526512介绍了B-tree/B+tree/B*tree,并且介绍了B-tree的查找，插入，删除操作。现在重新认识下B-TREE（温故而知新嘛~，确实如此。自己在写代码中会体会到，B-tree的操作出现的条件相对其他树比较复杂，调试也是一个理通思路的过程。)B-tree又叫平衡多路查找树。一棵m阶的B-tree 阅读全文

posted @ 2011-08-29 22:37 weedge 阅读(1039) 评论(0) 推荐(0)