09 2016 档案

摘要:在hive里面表可以创建成分区表,但是当分区字段的值是'' 或者 null时 hive会自动将分区命名为默认分区名称。 默认情况下,默认分区的名称为__HIVE_DEFAULT_PARTITION__ 当然默认分区名称是可配置的。 配置参数是 hive.exec.default.partition. 阅读全文
posted @ 2016-09-28 15:24 晨柳溪 阅读(3656) 评论(0) 推荐(0)
摘要:空指针NullPointerException 1 Hive之前的一些BUG [HIVE-9430] - NullPointerException on ALTER TABLE ADD PARTITION if no value given 意思是当为分区表增加新的分区的时候必须指定分区的值 Wro 阅读全文
posted @ 2016-09-28 15:08 晨柳溪 阅读(3714) 评论(0) 推荐(0)
摘要:从数据使用者的角度定义,高质量的数据应该是能充分满足用户使用要求的数据。 1:及时性:数据获取是否及时,主要指数据提取、传送、转换、加载、展现的及时性。在数据处理的各个环节,都会涉及到及时性。我们一般考虑两个方面第一就是接口数据是否能够及时的抽取过来。第二就是展现层能否及时的展现出来。 2:完整性: 阅读全文
posted @ 2016-09-12 17:45 晨柳溪 阅读(4185) 评论(0) 推荐(0)
摘要:企业数据的管理包含主数据,元数据,交易数据。 主数据是描述企业核心实体的基础数据,比如客户、用户、产品、员工等。 它是具有高业务价值的、可以在企业内跨越各个业务部门被重复使用的数据,并且存在于多个异构的应用系统中。 比如一个产品系统,它处理的基本数据就是生产数据。HR系统处理的基本数据是雇员;CRM 阅读全文
posted @ 2016-09-11 23:41 晨柳溪 阅读(1436) 评论(0) 推荐(0)
摘要:定义 进行需求采集之前,首先要清楚“需求”是什么意思,不然像是无头苍蝇只能到处乱撞了。 需求:需即需要,求即欲求,即个体客观或主观上的一种诉求。一般源自于用户理想上与现实中的差距所导致。 举个栗子:有志青年小明一直是简书的忠实用户,他自己也热爱写简书,从小就有个理想能够写出让大家喜爱的文章。现在,他 阅读全文
posted @ 2016-09-11 17:06 晨柳溪 阅读(482) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2016-09-11 14:58 晨柳溪 阅读(8) 评论(0) 推荐(0)