摘要: 最近的机器内存又爆满了,除了新增机器内存外,还应该好好review一下我们的代码,有很多代码编写过于随意化,这些不好的习惯或对程序语言的不了解是应该好好打压打压了。 下面是参考网络资源总结的一些在Java编程中尽可能要做到的一些地方。 1、尽量在合适的场合使用单例 使用单例可以减轻加载的负担,... 阅读全文
posted @ 2014-08-07 12:36 jseven 阅读(351) 评论(0) 推荐(0) 编辑
摘要: 1、组件: 元存储(Metastore )-存储“系统目录以及关于表、列、分区等的元数据”的组件。 驱动(Driver )- 控制 HiveQL 生命周期的组件,当 HiveQL 查询穿过 Hive时。该驱动管理着会话句柄以及任何会话的统计。 查... 阅读全文
posted @ 2014-08-07 09:24 jseven 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 基础概念: relation bag tuple field data 关系(relation) = 包(bag) 一个包是一个元组(tuple)的集合,在pig中用{}扩起来表示一个包 一个元组(tuple)是若干个字段的有序集合(order set),在pig的数据结构中,用()扩起来... 阅读全文
posted @ 2014-08-07 09:22 jseven 阅读(970) 评论(0) 推荐(0) 编辑