随笔分类 - 机器学习
摘要:概念: 一种常用于解决分类问题的机器学习方法,通俗地说就是推测一件事情发生的概率有多大。 例如判断某病人身上的肿瘤是良性还是恶性,结合肿瘤大小,厚度,位置等变量来预测,如果Y=0代表良性,Y=1代表恶性,这里的因变量Y只会是0或者1,就是最常见的二分类问题,逻辑回归也可用于多分类问题。 从之前的学习
阅读全文
摘要:之前我们讨论过一个线性回归的,里面是关于房屋售价和面积之间的关系,这个例子中特征只有一个,就是面积。 现在我们继续来讨论如果出现多个特征,通常情况下也是如此,人们在收售房屋时会考虑多个因素,比如新旧程度、地理位置、卧室数量、布局等等。这时特征数量不再是单一的,而是出现多个。 给出以下例子,考虑房屋面
阅读全文
摘要:梯度下降:应用最广泛的求极小值算法。 假设一线性回归模型,它的代价函数为 J(θ0,θ1) 。我们的目标是最小化这个代价函数,而要得到最小的代价函数值关键就在于正确选取 θ0和θ1的值,于是我们引出梯度下降算法。 步骤:1. 初始化θ0和θ1的值,通常取0。 2. 不断改变θ0和θ1的值,试图通过这
阅读全文
摘要:代价函数:又称损失函数,我的理解是用于更好地拟合样本,得到更合适模型的一个方法。 在线性回归中,假设函数为 hθ(x) = θ0 + θ1 * x ,其中θ0和θ1的变化会引起假设函数的变化,参数的选择决定了我们得到的直线相对于训练集的准确度。 为了让预测值和真实值的误差尽可能小和最小化θ0和θ1,
阅读全文
摘要:线性回归:简单来说就是通过一条直线来模拟现有数据,对未知数据进行预测,变量通常是连续的标量。 在吴恩达机器学习视频中,举出了最常见的线性回归例子——房价与面积的关系 上图中×表示真实的数据样本,横坐标代表房屋面积,纵坐标代表房屋价格。此时用一条直线模拟这组数据,即上图中穿插在数据点的线。 这条线我们
阅读全文
摘要:监督学习:通过人为地输入带有标签的训练数据集,使计算机训练得到一个较为合适的模型,对未知标签的数据进行预测。常见的监督学习算法:回归和分类。 1.回归(Regression):通常有两个及以上变量,数据一般是连续的,通过训练集变量之间的关系得到一条模拟训练样本的曲线,对未知数据的因变量进行预测,其中
阅读全文

浙公网安备 33010602011771号