摘要:
聚类算法: K-均值聚类算法:(以2分类算法为例) 1选择两个位置作为分类中心,并将所有点分类到距它更近的中心。 2对两组点,重新计算他们的中心。 不断重复以上步骤1和2,当分类中心和分组状态不再发生变化时,模型收敛。 如何平均拟合的好坏程度嘞?这里的损失函数是:。 选择不同数量的质点,其模型收敛时 阅读全文
摘要:
前向传播 前向传播是指,从输入层开始,逐层计算每个网络层的输出,直到输出层。 阅读全文
摘要:
GPT最近很火呀,那什么是GPT呢? 机器学习领域有个很好的模型叫 Transformer注意力模型,然后在此基础上发展出了包括GPT、BERT、GPT2.0以及GPT3.0等等。其发展历程大概是: (1)2018年,OpenAI基于Transformer提出了GPT; (2)2018年,Googl 阅读全文
摘要:
流形是指连在一起的区域:是一组点的集合,且每个点都有邻域。(也就意味着流形中某个元素可以通过某种方式移动到其邻域位置) 在机器学习中,我们允许流形的维数从一个点到另一个点有所变化。(这通常发生在流形与自身相交的情况。例如数字8,流形大多数位置只有一维,但在中心相交的时候,可移动方向变成两维)。 流形 阅读全文
摘要:
七、正则化(Regularization) 7.1 过拟合的问题 线性回归和逻辑回归能够有效地解决许多问题,但是当将它们应用到某些特定的机器学习场景时,会遇到过拟合(over-fitting)的问题,可能会导致它们效果很差。因此,我们需要一种正则化(regularization)的技术,它可以改善或 阅读全文
摘要:
4.1 多维特征 现在我们对房价模型增加更多的特征,例如房间数楼层等,构成一个含有多个变量的模型,模型中的特征为(x1,x2,x3,....,xn). 因此,用n表示特征的数量,用x(i)j 表示第i个实例的第j个特征。 则支持多变量的假设h可表示为:h(x(i))=sita0+sita1*x(i) 阅读全文
摘要:
3.1 矩阵和向量 这一节对矩阵和向量的概念进行描述,不再赘述。 3.2 加法和标量乘法 矩阵和矩阵的加法:对应元素相加 矩阵和标量乘法:矩阵的每个元素都与标量相乘 3.3 矩阵向量乘法 以及 3.4 矩阵乘法 都可以看作是矩阵乘法,第i行乘第j列,对应元素相乘再相加,然后放到结果矩阵的第i行第j列 阅读全文
摘要:
2.1 模型表示 本节将通过线性回归来了解监督学习的过程: 对于房价预测模型,我们之所以将其称为监督学习(因为对每个数据都有一个正确答案-真实的房价)。由于房价是一些连续的值,因此这是一个回归问题。 h代表学习算法的解决方案或函数也称为假设(hypothesis),监督学习算法的工作方式如下 要解决 阅读全文