会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
我的旧博客地址:
http://blog.itpub.net/29800581/
博客园
首页
新随笔
联系
订阅
管理
2017年12月24日
Hive修改行级别数据
摘要: 我们知道Hive0.14版本之前是不支持行级别的插入,更新,删除的,0.14版本之后可以通过修改相关配置得以支持,但是在不修改默认配置的情况下是不是完全没有办法呢?不是的,这里有个比较简单的方法,前提是表的存储格式为textfile~ 以下是例子: 当前表emp 存储格式为textfile 到hdf
阅读全文
posted @ 2017-12-24 13:55 jane_pop
阅读(8815)
评论(0)
推荐(0)
2017年12月17日
sqoop实现关系型数据库与hadoop之间的数据传递-import篇
摘要: 由于业务数据量日益增长,计算量非常庞大,传统的数仓已经无法满足计算需求了,所以现在基本上都是将数据放到hadoop平台去实现逻辑计算,那么就涉及到如何将oracle数仓的数据迁移到hadoop平台的问题。 这里就不得不提到一个很实用的工具——sqoop,它是一款开源的工具,主要用于实现关系型数据库与
阅读全文
posted @ 2017-12-17 16:27 jane_pop
阅读(3149)
评论(0)
推荐(0)
2017年12月9日
使用python将多个excel合并
摘要: 最近看视频学习,老师布置了个作业,关于如何使用python将多个excel进行合并,老师写的代码我感觉比较复杂,下面是我自己改良之后较简单的方式。 实现这个功能主要有两种方法,一种是用xlrd,xlsxwriter库结合,不管是xlsx,xls都是适用的;另一种是openpyxl,这个库只对xlsx
阅读全文
posted @ 2017-12-09 13:46 jane_pop
阅读(54665)
评论(1)
推荐(1)
公告