随笔分类 -  机器学习

机器学习
摘要:泰勒公式也称为泰勒中值定理,是高等数学中的一个重要定理,也是考研数学中的一个重要考点,常用于函数极限的计算、中值问题和不等式的证明以及函数的无穷级数展开式中,因此大家应该理解并熟练掌握其应用。有些同学在看到泰勒展开式的一长串数学式子后,感到很头疼,也记不住哪些公式。为了帮助这些同学理解并记住常用函数 阅读全文
posted @ 2021-06-16 09:34 fly_bk 阅读(153569) 评论(0) 推荐(1)
摘要:from sklearn.datasets import load_boston # 波士顿房价 boston = load_boston() X = boston.data y = boston.target print(X.shape) print(boston.feature_names) # 阅读全文
posted @ 2021-06-01 16:14 fly_bk 阅读(474) 评论(0) 推荐(0)
摘要:下载地址 https://ftp.gnu.org/gnu/octave/windows/ 阅读全文
posted @ 2021-04-19 09:25 fly_bk 阅读(97) 评论(0) 推荐(0)
摘要:概念 AUC(Area Under ROC Curve),指的是ROC曲线下面的面积,用于评估ROC曲线的性能。 计算 其实ROC的公式挺简单的,就是一个梯形面积的公式: 书上公式如下: 解读如下: xi+1 - xi为高(读者可以把图竖着看); yi + yi+1为上底加下底(详见蓝色那根线); 阅读全文
posted @ 2021-04-14 10:57 fly_bk 阅读(1055) 评论(0) 推荐(0)
摘要:从词向量计算概率 import numpy as np def loadDataSet(): """ 实验样本 :return: 第一个变量是进行词条切分后的文档集合,第二个变量是一个类别标签的集合 """ postingList = [['my', 'dog', 'has', 'flea', 'p 阅读全文
posted @ 2020-12-31 11:26 fly_bk 阅读(75) 评论(0) 推荐(0)
摘要:from math import log import operator """ 使用ID3算法划分数据集,ID3算法可以用于划分标称型数据集 决策树分类器就像带有终止块的流程图,终止块表示分类结果。 开始处理数据集时,首先需要测量集合中数据的不一致, 然后寻找最优方案划分数据集,直到数据集中的所有 阅读全文
posted @ 2020-12-30 12:16 fly_bk 阅读(179) 评论(0) 推荐(0)
摘要:K近邻算法采用测量不同特征值之间的距离方法进行分类 优点:精读高,对异常值不敏感,无数据输入假定 缺点:计算算杂度高,空间复杂度高。适合数据范围:数值型和标称型 K近邻算法是分类数据最简单最有效的算法。是基于实例的学习,使用算法时我们必须有接近实际数据的训练 样本数据。K近邻算法必须保存全部数据集, 阅读全文
posted @ 2020-12-24 12:45 fly_bk 阅读(210) 评论(0) 推荐(0)