摘要: 我们知道Hive0.14版本之前是不支持行级别的插入,更新,删除的,0.14版本之后可以通过修改相关配置得以支持,但是在不修改默认配置的情况下是不是完全没有办法呢?不是的,这里有个比较简单的方法,前提是表的存储格式为textfile~ 以下是例子: 当前表emp 存储格式为textfile 到hdf 阅读全文
posted @ 2017-12-24 13:55 jane_pop 阅读(8815) 评论(0) 推荐(0)
摘要: 由于业务数据量日益增长,计算量非常庞大,传统的数仓已经无法满足计算需求了,所以现在基本上都是将数据放到hadoop平台去实现逻辑计算,那么就涉及到如何将oracle数仓的数据迁移到hadoop平台的问题。 这里就不得不提到一个很实用的工具——sqoop,它是一款开源的工具,主要用于实现关系型数据库与 阅读全文
posted @ 2017-12-17 16:27 jane_pop 阅读(3149) 评论(0) 推荐(0)
摘要: 最近看视频学习,老师布置了个作业,关于如何使用python将多个excel进行合并,老师写的代码我感觉比较复杂,下面是我自己改良之后较简单的方式。 实现这个功能主要有两种方法,一种是用xlrd,xlsxwriter库结合,不管是xlsx,xls都是适用的;另一种是openpyxl,这个库只对xlsx 阅读全文
posted @ 2017-12-09 13:46 jane_pop 阅读(54665) 评论(1) 推荐(1)