摘要:
特征选择的目的 在理想情况下,特征选择想要达到以下效果: 简化模型以提高可解释性:通过减少特征的数量,模型变得更简单,更容易理解。这对于那些需要理解模型如何做出预测的领域(如医疗或信贷评分)非常重要。 改进模型性能:通过消除无关或冗余的特征,模型的预测性能可能会得到提高。这是因为无关或冗余的特征可能 阅读全文
posted @ 2023-07-25 10:44
半度墨水
阅读(1512)
评论(0)
推荐(0)
什么是正则化? 正则化是在机器学习中防止过拟合,提高模型的泛化能力的一种技术,我们训练模型就是对目标函数求解,而目标函数就是误差函数(损失函数)加正则化项,正则化项当中的 λ 被称为正则化系数,越大,这个限制越强。需要值得注意的是,正则化往往用在线性函数上面,如线性回归、逻辑回归,SVM等,复杂的神 阅读全文
什么是激活函数? 就是在人工神经网络的神经元上运行的函数,引入激活函数是为了增加神经网络模型的非线性,将非线性特性引入到神经网络中。 为什么要用激活函数 如果不用激活函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合,这种情况就是最原始的感知机(Perceptron 阅读全文
对于最简单的二分类任务: (此图叫混淆矩阵) TP:预测为Positive并且真实值也为Positive(样本为正类且预测为正类) TN:预测为Negative并且真实值也为Negative(样本为负类且预测为负类) FP:预测为Positive但真实值也为Negative(样本为负类但预测为正类) 阅读全文
列表是python中最常用到的数据结构之一,其中切片操作可以有很多使用技巧(包括倒序输出...) 对于一个列表 list = [1, 2, 3, 4, 5] list[-1] 原型是索引从左向右依次为0,1,2,3,4;与之对应的是-5,-4,-3,-3,-1,即 list[0] == list[- 阅读全文
损失函数(Loss Function)
机器学习模型关于单个样本的预测值与真实值的差称为损失。损失越小,模型越好,如果预测值与真实值相等,就是没有损失。用于计算损失的函数称为损失函数。模型每一次预测的好坏用损失函数来度量。 阅读全文