数据可视化

1、练习:学生来自哪里

  花4秒钟观察下表

 

  这个样本中的大多数学生来自哪个国家?
    美国
    加拿大
   (√)中国
    日本
    瑞典
    墨西哥
    德国

2、练习:频率

   请填入每个国家的频率:

  
国家频率
加拿大 2
中国  12
英国  2
德国  3
印度  8
日本  8
墨西哥  3
巴基斯坦  1
瑞典  1
美国 10

 

 

 

 

 

 

 

 

3、练习:每个、中国、巴基斯坦

  问题

    有多少学员来自美国?10

    有多少学员来自美国、中国或者巴基斯坦中的任意一个国家?23

    哪两个国家的学员人数最少?巴基斯坦、瑞典

4、练习:相对频率

  请输入中国、德国和日本的相对频率。

国家频率相对频率
加拿大 2 2/50 = 0.04
中国 12 0.24
英国 2  
德国 3 0.06
印度 8  
日本 8 0.16
墨西哥 3  
巴基斯坦 1  
瑞典 1  
美国 10  

 

 

 

 

 

 

 

 

 

5、练习:比例的范围

  问题:(样本中)所有比例均大于等于多少,小于等于多少?

  0~1

6、练习:相对频率之和

  问题:对于任何频率表,所有相对频率之和应当等于多少?

  1

7、练习:国家的比例

  

    问题

    来自美国的学员的比例是多少?0.20

    来自印度的学员的比例是多少?0.16

    下面哪一个大洲的学员比例更高?

      欧洲
     (√)亚洲

 8、练习:转换为百分比

  练习:请输入中国、德国和日本的百分比。

国家频率相对频率百分比
加拿大 2 0.04 4%
中国 12 0.24 24%
英国 2 0.04  
德国 3 0.06 6%
印度 8 0.16  
日本 8 0.16 16%
墨西哥 3 0.06  
巴基斯坦 1 0.02  
瑞典 1 0.02  
美国 10 0.20  

 
 
 
 
 
 
 
 
 
 
 
9、练习:百分比的范围
  填空:当我们使用百分比来表示相对频率时,百分比的范围区间是 [0]% 到 [100]% 之间。
10、练习:大洲
  练习:请在表格中输入每个大洲的频率和相对频率。
大洲频率相对频率
北美洲 15 30%
亚洲 29 58%
欧洲 6 12%

 

 

 

11、练习:行数

  你的表格需要多少行?

    □ 50 行(每个学员一行)
    □ 66 行(每个年龄一行,10-75)
    □ 8-10 行(这样表格比较简单易懂)
   (√)□ 取决于你如何去整理数据
    □ 2 行(大于50岁一行,小于50岁一行)

12、练习:组距
  

  请填入20-39岁对应的频率:50-(19+5+5)=21

13、数据可视化

  给出一组混乱无章的数据,我们可以通过频率表轻松地对数据可视化。

14、练习:直方图

  请标出四个分组扥别对应的高度

  

15、不同组距

  选择适当的组距

16、练习:更小的组距

17、练习:找到组距

  

18、练习:频率最大的年龄

  

 19、练习:60岁以上的比例

  

20、练习:60岁以下的百分比

  

21、练习:小于20岁

  

22、练习:大洲图表

  

23、练习:图表之间的差异

  

  左边的叫做直方图,右边的叫做柱状图。柱之间的这些空间表示,每个柱都是独特的类别,欧洲与北美完全不一样,与亚洲不一样,我们不会弄混它们。但是对于年龄来说,我们可以选择任何区间或组距。你可以更改年龄数据的组距,但是国家数据则不行。最后,各大洲的顺序并不重要,但是年龄只有一个顺序,从更小的年龄到更大的年龄。对于直方图来说,x轴上的变量是值,可以量化的,而对于柱状图来说,x轴上的变量通常分类或定性的。

24、练习:有偏差的图表

  

25、改变组距

  选择适合的组距

26、练习:解读直方图

  选择:不论组距是多少,下面哪个选项总是正确的?

  

27、偏斜分布

  选择:从这个分布图中,我们可以得出什么结论?

 

 

posted @ 2019-05-10 10:18  Lamfai  阅读(374)  评论(0编辑  收藏  举报