会员
周边
众包
新闻
博问
闪存
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
跳刀不跳
博客园
首页
新随笔
联系
订阅
管理
2019年6月19日
大数据学习笔记(一)
摘要: 一、大数据的基本处理步骤1)数据获取 flume 数据来源:专业数据机构,国家统计局,企业内部数据,互联网数据2)数据清洗 mapreduce 清除不需要,错误,无效的数据3)数据存储 hdfs 性能,可用,可靠,成本等方面考量4)数据处理 hive 按业务需求处理5)数据分享 sqoop,kett
阅读全文
posted @ 2019-06-19 10:37 跳刀不跳
阅读(455)
评论(0)
推荐(0)
公告