作业1 大数据概述与学习资源

1.了解微信、微博、小视频每天产生的数据量与数据类型。


微信:日登陆量达到10亿+,每天有8亿人进去朋友圈,还有4.1 亿音视频呼叫成功
微博:每天产生4亿+的数据量,数据库总量高达5.5亿+
小视频:每天产生几十亿的数据量
数据类型:number 、string 、boolean、object、function、array 、date、regexp


2.选择一个你感兴趣的领域应用数据思维进行分析决策的案例。


选择的是爱奇艺平台进行分析决策
目前日均DAU接近三亿,爱奇艺在业务初期主要关注于长视频,随后发展业务有PPC、UPC,同时还发展了游戏、直播、小说等业务。目前业务线达到20多条,存量的设备信息达到30亿,每天处理的用户行为日志超过300T。
整个爱奇艺技术部门所有数据、所有计算资源和服务框架,重新构建形成一个大数据平台框架。底层是大数据平台所用的计算资源,离线计算主要是Hive、Spark,流式计算主要是Spark Streaming和Flink;OLAP主要是Impala和Kylin。数据方面Pingback是用户行为日志,机器日志就是程序产生的相关日志。


3.大数据 人工智能 云计算 物联网 区块链的概念及相互关系。

大数据是收集,组织,处理和收集大型数据集洞察所需的非传统策略和技术的总称。
人工智能简称AI,主要研究如何用人工的方法和技术,使用各种自动化机器或智能机器(主要指计算机)模仿、延伸和扩展人的智能,实现某些机器思维或脑力劳动自动化。
云计算是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。
物联网是指通过信息传感设备,按约定的协议,将任何物体与网络相连接,物体通过信息传播媒介进行信息交换和通信,以实现智能化识别、定位、跟踪、监管等功能。

相互关系:
云计算为大数据提供了技术基础,大数据为云计算机提供用武之地,云计算为物联网提供海量数据存储能力,物联网为云计算技术提供了广阔的应用空间,物联网是大数据的重要来源,大数据技术为物联网数据分析提供支撑。


4.大数据的职业前景。
大数据的就业领域是很宽广的,不管是什么行业,都是需要大数据的技术进行处理。
大数据虽需大量的技术人才,但是竞争力非常大,市场需求庞大,主要是以大数据产业链为主。

posted @ 2020-09-12 19:12  欧克菲  阅读(155)  评论(0)    收藏  举报