08 2018 档案

大数据技术——数据处理和分析
摘要:大数据技术——数据处理和分析 场景:数据清洗,数据规范化,统计分析等。 1. 实时处理 对于实时数据及时处理,并输出结果。 推荐技术: SPARK STEAMING:一小段时间的批数据进行处理并产出。支持交互查询, STROM:纯实时处理,来一条处理一条。低延时,高容错性。 对于这两个技术,也是针对 阅读全文

posted @ 2018-08-13 01:28 hzuCode 阅读(632) 评论(0) 推荐(0)

大数据技术——数据获取
摘要:主要介绍大数据获取的应用和场景,组件和技术不做详述,之后介绍。 1. 网络爬虫 根据URL,并按照一定规则爬取网页内容,存储进库。 相关概念: https://baike.baidu.com/item/%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB 推荐技术: PYTHON 阅读全文

posted @ 2018-08-12 23:45 hzuCode 阅读(841) 评论(0) 推荐(1)

导航