摘要:
寻找应用程序中占用时间最长的部分 阅读全文
阅读排行榜
Learning by doing 系列文章概述
2011-10-10 23:43 by Haippy, 758 阅读, 收藏,
摘要:
Learning by doing 系列文章主要是根据自己在学习中遇到的问题以及解决方法和一些感想写成。俗话说,实践是检验真理的唯一标准,只有在实践中才会正真学到自己想要的东西。 阅读全文
(转载)从 Java 代码到 Java 堆
2012-05-01 22:25 by Haippy, 718 阅读, 收藏,
摘要:
本文将为您提供 Java™ 代码内存使用情况的深入见解,包括将 int 值置入一个 Integer 对象的内存开销、对象委托的成本和不同集合类型的内存效率。您将了解到如何确定应用程序中的哪些位置效率低下,以及如何选择正确的集合来改进您的代码。 阅读全文
Hbase 介绍(转载)
2011-12-05 16:02 by Haippy, 672 阅读, 收藏,
摘要:
hbase是bigtable的开源山寨版本。是建立的hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。 阅读全文
cpy-leveldb0.3.2发布
2011-09-17 18:16 by Haippy, 659 阅读, 收藏,
摘要:
概述首先leveldb是google开源的高性能k-v数据库(http://code.google.com/p/leveldb/),具有极高的读写效率和速度。而cpy-leveldb(https://github.com/forhappy/cpy-leveldb)是根据leveldb c api的基础上写的python 绑定,并且0.3.x系列版本重写了代码,由以前的单文件项目结构分为目前的多文件结构,代码简介高效速度快,并增加了一些测试集和文档。cpy-leveldb 0.3.2功能简介目前支持的功能除了leveldb的基本的Put,Get, Delete, Write, Property 阅读全文
MapReduce Hold不住? (转载)
2011-12-04 20:51 by Haippy, 532 阅读, 收藏,
摘要:
本文系统地介绍和分析比较了业界主流的Yahoo! S4、StreamBase和Borealis三种流式计算系统,希望读者能从这些系统的设计中领悟到不同场景下流式计算所要解决的关键问题。 阅读全文
HBase vs. BigTable Comparison
2011-12-10 16:11 by Haippy, 505 阅读, 收藏,
摘要:
HBase vs. BigTable Comparison 阅读全文
[InfoQ]Twitter Storm:开源实时Hadoop (转载)
2011-12-04 20:55 by Haippy, 417 阅读, 收藏,
摘要:
Twitter将Storm正式开源了,这是一个分布式的、容错的实时计算系统,它被托管在GitHub上,遵循 Eclipse Public License 1.0。Storm是由BackType开发的实时处理系统,BackType现在已在Twitter麾下。GitHub上的最新版本是Storm 0.5.2,基本是用Clojure写的。 阅读全文
Bloom Filter 概念和原理(转载)
2011-12-03 20:21 by Haippy, 409 阅读, 收藏,
摘要:
Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter不适合那些“零错误”的应用场合。而在能容忍低错误率的应用场合下,Bloom Filter通过极少的错误换取了存储空间的极大节省。 阅读全文
浙公网安备 33010602011771号