摘要:
传统编程的关注点是代码。在机器学习项目中,关注点变成了特征表示。也就是说,开发者通过添加和改善特征来调整模型。 表示:特征工程 将原始数据映射到特征 下图左侧表示来自数据源的原始数据,右侧表示特征矢量,也就是组成数据集中样本的浮点值集。特征工程指的是将原始数据转换为特征矢量。进行特征工程预计需要大量 阅读全文
posted @ 2021-05-26 16:52
Yuanb
阅读(199)
评论(0)
推荐(0)
摘要:
本节介绍泛化。 泛化:过拟合的风险 为了更好的理解这一概念,请看如下例子:假设下图中的每个点代表一棵树在森林中的位置。图中的两种颜色分别代表以下含义,蓝点代表生病的树,橙点代表健康的树。 您能设想出一个有效的模型来预测以后的生病或健康的树吗?花点时间在脑海里绘制一条弧线将蓝点与橙点分开,或者在脑海中 阅读全文
posted @ 2021-05-26 15:03
Yuanb
阅读(142)
评论(0)
推荐(0)
摘要:
定义:机器学习系统通过如何组合输入信息来对从未见过的数据做出有用的预测。 基本术语 标签:标签是我们要预测的事物,即简单线性回归中的$y$变量。 特征:特征是输入变量,即简单线性回归中的$x$变量,特征可以有多个,是一种可量化的指标。 样本:样本是指数据的特定实例$X$,样本分为有标签样本和无标签样 阅读全文
posted @ 2021-05-26 10:48
Yuanb
阅读(578)
评论(0)
推荐(0)

浙公网安备 33010602011771号