2013年6月8日

HBase一次慢查询请求的问题排查与解决过程

摘要: 最近HBase集群遇到过一次慢查询请求的问题,下面是对这一问题的具体描述及排查解决过程。 阅读全文

posted @ 2013-06-08 14:22 大圆那些事 阅读(13168) 评论(1) 推荐(0) 编辑

2013年5月29日

WordPress主题文件UTF-8 BOM带来的问题及解决方法

摘要: 最近在Windows下修改一个WordPress主题时,以UTF-8 BOM格式保存文件,后来导致网站页面在IE下出现无法居中显示等问题。下面是具体的排查和解决过程,留作日后参考。 阅读全文

posted @ 2013-05-29 11:56 大圆那些事 阅读(1343) 评论(0) 推荐(0) 编辑

2013年4月29日

Hive中视图机制的初步使用及分析

摘要: 本文是对Hive中逻辑视图的介绍,通过一个简单的视图例子,说明其使用方法及执行过程。 阅读全文

posted @ 2013-04-29 11:00 大圆那些事 阅读(10999) 评论(0) 推荐(0) 编辑

数据迁移工具Sqoop和DataX功能比较

摘要: 最近由于项目需要,对Apache Sqoop和Taobao DataX工具进行了调研,这里是对二者功能的初步梳理,不会涉及技术细节和使用方法,留作日后选型参考。 阅读全文

posted @ 2013-04-29 10:34 大圆那些事 阅读(21348) 评论(3) 推荐(0) 编辑

2013年3月23日

HiveServer2连接ZooKeeper出现Too many connections问题的解决

摘要: HiveServer2支持多客户端的并发访问,使用ZooKeeper来管理Hive表的读写锁。实际环境中,遇到了HiveServer2连接ZooKeeper出现Too many connections的问题,这里是对这一问题的排查和解决过程。 阅读全文

posted @ 2013-03-23 14:44 大圆那些事 阅读(10977) 评论(3) 推荐(1) 编辑

2013年3月22日

Hadoop Capacity Scheduler配置使用记录

摘要: 这里参考Capacity Scheduler Guide,结合自己的实践经验,对Capacity Scheduler的主要配置参数进行总结。 阅读全文

posted @ 2013-03-22 23:10 大圆那些事 阅读(2587) 评论(0) 推荐(0) 编辑

2013年2月21日

开源实时流处理系统小结

摘要: 这里对目前业界开源的一些实时流处理系统做一次小结,作为日后进行技术调研的参考资料。 阅读全文

posted @ 2013-02-21 12:06 大圆那些事 阅读(13635) 评论(3) 推荐(3) 编辑

2012年12月24日

GZIP、LZO、Zippy/Snappy压缩算法应用场景小结

摘要: GZIP、LZO、Zippy/Snappy是常用的几种压缩算法,各自有其特点,因此适用的应用场景也不尽相同。这里结合相关工程实践的情况,做一次小结。 阅读全文

posted @ 2012-12-24 10:30 大圆那些事 阅读(54127) 评论(11) 推荐(2) 编辑

2012年12月16日

Storm使用到的相关技术总结

摘要: Storm作为一个开源的分布式实时流计算框架,其内部实现使用了一些常用的技术,这里是对这些技术及其在Storm中作用的概括介绍。以此为基础,后续再深入了解Storm的内部实现细节。 阅读全文

posted @ 2012-12-16 11:57 大圆那些事 阅读(13450) 评论(0) 推荐(0) 编辑

2012年11月30日

Storm集群安装部署步骤【详细版】

摘要: 本文以Twitter Storm官方Wiki为基础,详细描述如何快速搭建一个Storm集群,其中,项目实践中遇到的问题及经验总结,在相应章节以“注意事项”的形式给出。 阅读全文

posted @ 2012-11-30 15:08 大圆那些事 阅读(71411) 评论(8) 推荐(5) 编辑

导航