随笔分类 - 统计学
摘要:以抛一枚硬币为例,一次试验只有两种可能,Ω = {正面,反面},这两种可能是互斥的,不可能同时发生,一种可能也可以说一个事件发生了,就湮灭了另一个事件发生的可能性。 所以,说两个事件互斥,也就意味着在一次试验当中,这两个事件不会同时发生,即P(AB) = 0,两者没有交集。 但是两个事件相互独立吗?
阅读全文
摘要:求事件乘客等候不到5分钟乘上车的概率 汽车到达的时间点:7:15和7:30, 乘客等候不到5分钟乘车的条件为:7:10—7:15 或者 7:25—7:30 到达车站 事件所包含的样本点为:7:10—7:15 或者 7:25—7:30 两个时间段 总共的样本空间为:7:00—7:30 P = (5+5
阅读全文
摘要:求事件n个人当中至少有2人生日同一天的概率,考虑其对立事件n个人当中没有人生日在同一天的概率会比较容易 n个人当中没有人生日在同一天,即第一个人的生日有365种选择,第二人有364种选择…… 事件包含的样本空间有 356*364*……*(365-n+1) 总的样本空间有 365**n
阅读全文
摘要:第k位顾客中奖这个事件,意味着前k-1位顾客没有中奖,这个事件的完成需要k个步骤 第一步:第一个顾客从n-1张没奖的奖券中抽一张,共包含n-1个样本点 第二步:第二个顾客从n-2张没奖的奖券中抽一张,共包含n-2个样本点 …… 第k-1步:第k-1个顾客从n-k+1张没奖的奖券中抽一张,共包含n-k
阅读全文
摘要:加法原理:做一件事情,完成它有n类方式,第一类方式有M1种方法,第二类方式有M2种方法,……,第n类方式有Mn种方法,那么完成这件事情共有M1+M2+……+Mn种方法。 乘法原理:做一件事,完成它需要分成n个步骤,做第一步有m1种不同的方法,做第二步有m2种不同的方法,……,做第n步有mn种不同的方
阅读全文
摘要:编程理解无偏性与相合性 无偏性 1 from statistics import mean 2 from statistics import variance 3 import random 4 import matplotlib.pyplot as plt 5 6 7 def variance_b
阅读全文
摘要:如何估计总体的均值? 通过抽样得到样本均值,但显然一个样本不足以消除偶然性,所以需要多次抽样, 多次样本可以得到多个样本均值,这些样本均值 的 期望,就可以代表总体均值。 如何估计总体的方差? 多次抽样得到多个样本,每个样本计算一次方差,可以得到多个方差, 注意:计算每一个样本的方差时要除的是n-1
阅读全文
摘要:在适当的条件下,相互独立的随机变量之和经适当标准化后,其分布近似于正态分布;不要求变量本身服从正态分布。 代码: 1 import random 2 import matplotlib.pyplot as plt 3 from statistics import mean 4 5 6 def sam
阅读全文
摘要:1 import random 2 import matplotlib.pyplot as plt 3 4 5 # 掷硬币,头0,花1 6 def toss(): 7 return random.randint(0, 1) 8 9 10 if __name__ == "__main__": 11 1
阅读全文
摘要:1 from collections import Counter 2 from math import sqrt 3 4 def frequency(data): 5 """频率""" 6 counter = Counter(data) 7 ret = [] 8 for point in coun
阅读全文
摘要:1.数据的可靠性和有效性 2.利用图表对数据进行可视化 2.1分类变量的可视化 2.11无序分类变量 2.12有序分类变量的可视化 2.1数值变量的可视化 数据的分布
阅读全文
摘要:统计学是通过什么检测两个变量之间是否有关系? 例如身高和性别是否有关系 答:通过检测男性样本的身高均值 VS 女性样本的身高均值 是否有差异, 有差异就说明两个变量之间存在关系。检验均值的差异是否为零,不看大小只看是否为零 参数估计 例题:北京市领导想知道当年住宅价格增长率是否达到了国家限定的阈值,
阅读全文

浙公网安备 33010602011771号