上一页 1 ··· 29 30 31 32 33 34 35 36 37 ··· 41 下一页
摘要: 优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜。 理解Hadoop的核心能力,是hive优化的根本。这是这一年来,项目组所有成员宝贵的经验总结。 长期观察hadoop处理数据的过程,有几个显著的特征: 1.不怕数据多,就怕数据倾斜。 2.对jobs数比较多的作业运行效 阅读全文
posted @ 2016-08-03 15:55 宝山方圆 阅读(385) 评论(0) 推荐(0)
摘要: 一、概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,如图 1 。 星型架构 阅读全文
posted @ 2016-08-03 15:45 宝山方圆 阅读(402) 评论(0) 推荐(0)
摘要: 带limit的hivesql排序 select requestdomain,count(1) as cnt from ods_cndns_real_log where dt = 20160707 group by requestdomain order by cnt desc limit 1000; 阅读全文
posted @ 2016-08-03 15:32 宝山方圆 阅读(9272) 评论(0) 推荐(0)
摘要: 【转自】http://blog.sina.com.cn/s/blog_616e189f0100ne1t.html 1. 基本的java Frame操作。 Java的图形界面的类主要包括AWT和Swing。在AWT中图形元素的父类为Component。 继承关系如下:Component->Contai 阅读全文
posted @ 2016-07-30 06:04 宝山方圆 阅读(17084) 评论(0) 推荐(0)
摘要: 报错信息: 2016-07-27 10:53:14,102 WARN org.apache.hadoop.yarn.server.nodemanager.LinuxContainerExecutor: Exit code from container exec utor initialization 阅读全文
posted @ 2016-07-27 14:52 宝山方圆 阅读(3851) 评论(0) 推荐(0)
摘要: CDH-LZO配置 下载和CDH版本对应的hadoop-lzo版本 如下: 下载地址:http://archive.cloudera.com/gplextras5/parcels/ 需要下载如下三个文件: GPLEXTRAS-5.4.0-1.cdh5.4.0.p0.27-el6.parcel GPL 阅读全文
posted @ 2016-07-22 14:21 宝山方圆 阅读(4083) 评论(4) 推荐(0)
摘要: 二叉树 1.所有非叶子结点至多拥有两个儿子(Left和Right); 2.所有结点存储一个关键字; 3.非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树; 如: 二叉树的搜索,从根结点开始,如果查询的关键字与结点的关键字相等,那么就命中; 否则,如果查询关键字比结点关键字小,就 阅读全文
posted @ 2016-07-22 07:22 宝山方圆 阅读(16062) 评论(0) 推荐(2)
摘要: MySQL凭借着出色的性能、低廉的成本、丰富的资源,已经成为绝大多数互联网公司的首选关系型数据库。虽然性能出色,但所谓“好马配好鞍”,如何能够更好的使用它,已经成为开发工程师的必修课,我们经常会从职位描述上看到诸如“精通MySQL”、“SQL语句优化”、“了解数据库原理”等要求。我们知道一般的应用系 阅读全文
posted @ 2016-07-21 17:49 宝山方圆 阅读(260) 评论(0) 推荐(0)
摘要: 前言 在2014年初,我们将线上使用的 Hadoop 1.0 集群切换到 Hadoop 2.2.0 稳定版, 与此同时部署了 Hadoop 的安全认证。本文主要介绍在 Hadoop 2.2.0 上部署安全认证的方案调研实施以及相应的解决方法。 背景 集群安全措施相对薄弱 最早部署Hadoop集群时并 阅读全文
posted @ 2016-07-21 16:25 宝山方圆 阅读(6648) 评论(0) 推荐(0)
摘要: Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。 在几次升级Hive的过程中,我们遇到了一些大大小小的问题。通过向社区 阅读全文
posted @ 2016-07-21 15:35 宝山方圆 阅读(2706) 评论(0) 推荐(0)
上一页 1 ··· 29 30 31 32 33 34 35 36 37 ··· 41 下一页