数据科学【系列1】|统计入门|正态分布和概率密度函数(上)

数据科学【系列1】|统计入门|正态分布和概率密度函数(上)_哔哩哔哩_bilibili

很多假设检验有一定的前提条件,要求数据有一定的正态性,中心极限定理充当了这一桥梁。

连续型随机变量的一个很重要的分布就是正态分布。

例子:小明买楼盘或者别墅,只有206万块钱。所以,他要利用概率和统计的知识估计自己的钱够不够。判断下房价小于206万的概率,从而知道一下自己的钱够不够买别墅。

 

 

假设楼市的价格的分布服从于正态分布。

引入两个概念:

描述离散型随机变量的概率分布:概率质量函数。

描述连续型随机变量的概率分布:概率密度函数。

离散型随机变量举例:

猫妈妈生小猫,每一窝生的小猫的数量是个随机数。

 

2、3、4、5、6、7、8是生的小猫的数量,柱状图是对应的概率。

 

注解:

1.离散型随机变量,可以求得它取某一个具体值的时候,它的概率是多少。

 

 

注解:

1.连续型随机变量的概率密度函数的图像,它的纵坐标是变量取某一个具体值的概率密度,而不是概率。

2.对于连续型随机变量,一般会求某个随机变量在某一个取值范围内,它的概率是多少。

 

 

 

注解:

1.体重在10到20磅的这个范围内的概率是多大?

答:是对应的曲线下面阴影部分的面积。

 

 

 

注解:

1.连续型随机变量取某个值的概率是0的另一个解释是:连续型随机变量取某个值的概率对应图像上的一条线,而一条线是没有面积的,所以,取某个值的概率是0.

 

注解:

1.方差/标准差描述了一些数据相对于它们的均值而言,是多么的分散。

 

posted on 2022-04-15 18:04  一杯明月  阅读(810)  评论(0)    收藏  举报