随笔分类 - 机器学习
摘要:# -*- coding:utf-8 -*- __Author__ = "KrianJ wj_19" __Time__ = "2020/3/17 12:23" __doc__ = """ """ import numpy as np def data_initialize(A, B, pai, O)
阅读全文
摘要:一、基本形式 设定由n个属性描述的示例X = (x1; x2; x3; ...; xn),xi是X第i个属性的取值。线性模型尝试通过属性的线性组合来进行描述和预测 f(X) = w1*x1 + w2*x2 + ...+wn*xn + b, 其中w是各属性的组合系数。f(X)也可以用向量形式表达。学得
阅读全文
摘要:模型评估是对学习器泛化能力有效可行的实验估计方法。而性能度量是衡量模型泛化能力的评价标准。性能度量反应了任务需求,在对比不同模型能力时,使用不同的性能度量往往会导致不同的评估结果。模型的好坏不仅取决于算法和数据,还有任务需求。 1.错误率与精度 最常用的两种性能度量,对于样例集D={(x1,y1),
阅读全文
摘要:一.经验误差和过拟合 错误率 E=a/m, a分类错误的样本数,m样本总数 精度 = 1 - E。 学习器在训练集上的误差:训练误差;在新样本上的误差:泛化误差。好的学习器应在新样本上表现优秀,因此学习器应尽可能掌握样本的潜在规律,提升泛化性能。 过拟合:学习能力过于强大,样本训练时将样本“自身特点
阅读全文
摘要:一、学习任务的分类 1。监督学习(supervised learning):分类、回归等。监督指标签,监督学习通过已知训练样本得到最优训练模型,适用于新数据上。反复这样的过程,模型就有了预测能力。 2.无监督学习(unsupervised learning):聚类等,不通过训练直接对数据进行建模分析
阅读全文


浙公网安备 33010602011771号