摘要: 大数据一般处理流程: 数据源:关系型数据库、日志文件、三方数据 --> 数据采集或同步:sqoop(RDBMS与HDFS直接的导入与导出)、flume(日志文件,给HDFS及kafka)、kafka(实时数据处理) --> 数据存储:HDFS、Hbase、ES --> 数据清洗:MapReduce、 阅读全文
posted @ 2024-04-02 15:01 潇潇暮鱼鱼 阅读(103) 评论(0) 推荐(0)