10 2021 档案

摘要:使用sklearn去实现bagging分类 这里采用3次10折交叉验证 # test classification dataset from sklearn.datasets import make_classification # define dataset X, y = make_classi 阅读全文
posted @ 2021-10-25 10:47 pha创噬 阅读(500) 评论(0) 推荐(0)
摘要:蒙提霍尔问题:假如你参与一个有主持人的游戏,你会看见三扇关闭了的门,其中一扇的后面有一辆汽车,另外2扇门后面各是一只山羊,你看不见门后面的情况,但主持人知道一切。你被主持人要求在三扇门中选择一扇,但不能打开,在你选定之后主持人开启了另一扇后面有山羊的门,然后你可以坚持原来选定的门,也可以改主意重新选 阅读全文
posted @ 2021-10-25 09:13 pha创噬 阅读(91) 评论(0) 推荐(0)
摘要:目标: 从一个分布服从指数分布的随机变量中去抽取1000个变量,问这1000个变量中至少有20个变量数值大于18的概率 其中指数分布的 lamb = 0.2 import numpy as np ''' 从一个分布服从指数分布的随机变量中去抽取c个变量,问这c个变量中至少有t个变量数值大于h的概率 阅读全文
posted @ 2021-10-25 08:52 pha创噬 阅读(323) 评论(0) 推荐(1)
摘要:思路: 画出一个边长为1的正方形;然后,以正方形的中心为原点,建立一个二维坐标系,并以原点画出一个单位圆。 此时,在这个正方形里面放点,那么点落在圆里面的概率 等于 圆的面积:PI * R * R = PI / 4 P = PI / 4 → PI = P * 4 = dis_n / n * 4 im 阅读全文
posted @ 2021-10-24 22:04 pha创噬 阅读(140) 评论(0) 推荐(0)
摘要:[toc] ## 第二次作业 #### 第一题 <b>题目描述</b><br> 1.如下表数据,前四列是天气情况(阴晴outlook,气温temperature,湿度humidity,风windy);最后一列是类标签,表示根据天气情况是否出去玩。 (1)“信息熵”是度量样本集合纯度最常用的一种指标, 阅读全文
posted @ 2021-10-15 13:48 pha创噬 阅读(3211) 评论(2) 推荐(0)
摘要:参考blog and 视频 高斯混合模型 EM 算法的 Python 实现 如何通俗理解EM算法 机器学习-白板推导系列(十一)-高斯混合模型GMM EM算法的定义 最大期望算法(Expectation-maximization algorithm,又译为期望最大化算法),是在概率模型中寻找参数最大 阅读全文
posted @ 2021-10-07 17:05 pha创噬 阅读(818) 评论(0) 推荐(0)
摘要:第一次作业 第一题 题目描述 现已使用 Pandas 读取数据集 challenge.csv 请提取该数据集的字段名称,将结果存为 cols 请获取给数据的字段和样本数量,将结果分别存为 col_num 和 sam_num 请获取该数据集的前五行记录,将最后的 DataFrame 存为 five_d 阅读全文
posted @ 2021-10-05 10:31 pha创噬 阅读(1163) 评论(2) 推荐(0)