上一页 1 2 3 4 5 6 7 8 ··· 16 下一页
摘要: 本文内容参考自如下博客与书籍:http://blog.csdn.net/windowseight/article/details/8279863http://bbs.chinaunix.net/thread-2083672-1-1.htmlhttp://blog.csdn.net/erazy0/ar... 阅读全文
posted @ 2015-10-30 15:15 Jingle Guo 阅读(286) 评论(0) 推荐(0) 编辑
摘要: 经常遇到一些刚接触Linux的新手会问内存占用怎么那么多?在Linux中经常发现空闲内存很少,似乎所有的内存都被系统占用了,表面感觉是内存不够用了,其实不然。这是Linux内存管理的一个优秀特性,在这方面,区别于Windows的 内存管理。主要特点是,无论物理内存有多大,Linux 都将其充份利用,... 阅读全文
posted @ 2015-10-30 14:37 Jingle Guo 阅读(112) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘领域一 直都非常的火。现在炒的非常热的大数据,其实也是数据挖掘的一个应用而已,不管工程师用的是Hadoop还是其他平台,其实都是对一堆的数据进行分析,计 算,然后得到我们希望得到的结果。所以我们可以知道,文本数据挖掘的必要性是因为信息技术,特别是网络的频繁使用,自媒体的越来越多,从大海中找... 阅读全文
posted @ 2015-10-30 11:11 Jingle Guo 阅读(232) 评论(0) 推荐(0) 编辑
摘要: 谈到BI,就会谈到数据挖掘(Data mining)。数据挖掘是指用某些方法和工具,对数据进行分析,发现隐藏规律并利的一种方法。下面我们将通过具体的例子来学习什么是数据挖掘。案例“上大学分析”-体验什么是数据挖掘某社会机构,收集了大量的学生考大学的数据。该机构希望找出一些规律,以推动更多的学生考大学... 阅读全文
posted @ 2015-10-30 10:43 Jingle Guo 阅读(112) 评论(0) 推荐(0) 编辑
摘要: 很有段时间没写此系列了,今天我们来说Trie树,Trie树的名字有很多,比如字典树,前缀树等等。一:概念 下面我们有and,as,at,cn,com这些关键词,那么如何构建trie树呢?从上面的图中,我们或多或少的可以发现一些好玩的特性。 第一:根节点不包含字符,除根节点外的每一个子节点都包含... 阅读全文
posted @ 2015-10-29 16:32 Jingle Guo 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 说到排序,大家第一反应基本上是内排序,是的,算法嘛,玩的就是内存,然而内存是有限制的,总有装不下的那一天,此时就可以来玩玩外排序,当然在我看来,外排序考验的是一个程序员的架构能力,而不仅仅局限于排序这个层次。一:N路归并排序1.概序 我们知道算法中有一种叫做分治思想,一个大问题我们可以采取分而治... 阅读全文
posted @ 2015-10-29 16:29 Jingle Guo 阅读(89) 评论(0) 推荐(0) 编辑
摘要: 1.简介倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。带有倒排索引的文件我们称为倒排索引文件,简称倒排文件(inverte... 阅读全文
posted @ 2015-10-29 16:24 Jingle Guo 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 【什么是双层桶】 事实上,与其说双层桶划分是一种数据结构,不如说它是一种算法设计思想。面对一堆大量的数据我们无法处理的时候,我们可以将其分成一个个小的单元,然后根据一定的策略来处理这些小单元,从而达到目的。【适用范围】 第k大,中位数,不重复或重复的数字【基本原理及要点】 因为元素范围很大,不能利用... 阅读全文
posted @ 2015-10-29 16:04 Jingle Guo 阅读(1229) 评论(0) 推荐(0) 编辑
摘要: 索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。数据库索引什么是索引 数据库索引好比是一本书前面的目录,能加快数据库的查询速度。 例如这样一个查询:select * from table1 where id=44。如果没有索引,必须遍历整个表,直到ID... 阅读全文
posted @ 2015-10-29 16:00 Jingle Guo 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 【什么是堆】概念:堆是一种特殊的二叉树,具备以下两种性质1)每个节点的值都大于(或者都小于,称为最小堆)其子节点的值2)树是完全平衡的,并且最后一层的树叶都在最左边这样就定义了一个最大堆。如下图用一个数组来表示堆:那么下面介绍二叉堆:二叉堆是一种完全二叉树,其任意子树的左右节点(如果有的话)的键值一... 阅读全文
posted @ 2015-10-29 15:51 Jingle Guo 阅读(106) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 16 下一页