摘要: 如果你要看这篇文章,希望你对inputStream流的读取已经有所了解。 InputStream读取流有三个方法,分别为read(),read(byte[] b),read(byte[] b, int off, int len)。在从数据流里读取数据时,为图简单,经常用InputStream.rea 阅读全文
posted @ 2018-12-16 19:45 数据天空 阅读(31405) 评论(0) 推荐(1) 编辑
摘要: 数据仓库简介:有些人不理解数据仓库,认为数据仓库就是获取数据,只要会使用hadoop、spark等大数据工具就懂数据仓库,这样的认识太片面。如果要从海量数据中总结出一个报表或者是多个报表,大数据工程师足以;如果在有限的资源动态的数据情况下,向前可历史追溯,向后对不断增加的报表实现兼容,这就需要一套科 阅读全文
posted @ 2018-07-29 14:37 数据天空 阅读(6281) 评论(0) 推荐(0) 编辑
摘要: greenplum 创建分区表 CREATE TABLE fi_middle.order_detail ( date_id integer, order_id character varying(22), product_id character varying(50), order_quantit 阅读全文
posted @ 2018-07-24 11:30 数据天空 阅读(6765) 评论(0) 推荐(0) 编辑
摘要: 任务调度系统 , 作业调度系统,定时调度,依赖调度 阅读全文
posted @ 2017-10-01 11:10 数据天空 阅读(1035) 评论(0) 推荐(0) 编辑
摘要: 主要利用visio开发者模式,在没有开发帮助文档的情况下,实现对visio文件的处理 Sub Macro3() 'Enable diagram services Dim DiagramServices As Integer DiagramServices = ActiveDocument.Diagr 阅读全文
posted @ 2017-08-02 23:20 数据天空 阅读(850) 评论(0) 推荐(0) 编辑
摘要: 今天遇到一个数仓工程师经常会遇到的一个棘手问题,就是要提取一个供应商从2007到2017年来销售的数据明细,本来从现有的数据作业关系架构图中很容易取出这些数据,但是第一数据跨度太长,这种非原始数据底层只存了近5年的数;第二如果冲底层重新生成数据,由于供应商数据不是直接从底层处理而来,有好几个前置作业 阅读全文
posted @ 2017-08-01 00:11 数据天空 阅读(246) 评论(0) 推荐(0) 编辑
摘要: COPY 命令可以快速的导入数据到 PostgreSQL 中,文件格式类似CVS,txt之类。适合批量导入数据,比自己写脚本逐条插入快很多 文件导入数据库主要分三个步骤: 首先,你必须Linux系统中存在这个文件,比如/home/user/test.csv 数据只有一列,如下: 1 2 3 4 5 阅读全文
posted @ 2017-05-25 20:14 数据天空 阅读(4681) 评论(0) 推荐(0) 编辑