了解大数据的特点、来源与数据呈现方式

作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639

1.浏览2019春节各种大数据分析报告

2.这些分析所采用数据的来源

  1. 来源于购票网站的购票记录
  2. 交通运输部和地图软件提供的数据
  3. 银联,携程提供的数据
  4. 文化和旅游部数据中心,商务部,国家电影局提供的数据
  5. 天猫购物提供的数据.商务部,银联,盒马鲜生,旅游协会
  6. 微信提供的数据

以上这些数据,均是将记录的数据整理,分析所得出来的

3.大数据的呈现方式有哪些?

  • 面积&尺寸可视化对同一类图形(例如柱状、圆环和蜘蛛图等)的长度、高度或面积加以区别,来清晰的表达不同指标对应的指标值之间的对比。
  • 颜色可视化
  • 图形可视化在我们设计指标及数据时,使用有对应实际含义的图形来结合呈现,会使数据图表更加生动的被展现,更便于用户理解图表要表达的主题。
  • 地域空间可视化当指标数据要表达的主题跟地域有关联时,我们一般会选择用地图为大背景。
  • 概念可视化通过将抽象的指标数据转换成我们熟悉的容易感知的数据时,用户便更容易理解图形要表达的意义。

4.大数据的特点是什么?结合大数据应用案例,分析大数据对思维方式有何影响?

大数据有4个特点:

  • Volume(大量)
  • Variety(多样)
  • Velocity(高速)
  • Value(价值)

大数据影响

总体性思维:人们处理的数据从单一样本数据变成全量数据(全样本数据)。例子:微信红包统计

容错性思维:由于是海量数据和全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求。例子:大多数数据百分比呈现

关联性思维:人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相关性关系(即数据的关联性关系)。例子:天猫推荐

智能化思维:通过机器学习可以从数据中获取有价值的学习数据,大数据将有效的推进机器思维方式由自然思维转向智能化思维。

5.准备python编程环境

Anaconda是一个开源的包、环境管理器,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换
Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpypandas等。

 

本博客通过下载anaconda3来进行python的安装,并利用spyder进行python的编写。

 

6.简单的输入输出编程练习

设计完成一个Mad Libs游戏:

  1. 创造一个让人欢乐的有趣的故事;
  2. 提示伙伴输入相应类别的词;
  3. 将故事完整地输出。

 

代码展示

"""
Created on Mon Mar  4 20:22:23 2019

@author: GMUK
"""

author=input("输入一个名字:")
job=input("输入一个职业:")
word=input("输入一个名词:")
print("{}{}说,我从来不{},我只是在努力的认清现实。".format(job,author,word))

 

运行效果

 

posted @ 2019-03-04 20:29  GMUK  阅读(189)  评论(0编辑  收藏  举报