摘要: Q1 过拟合与欠拟合的区别是什么,什么是正则化 欠拟合指的是模型不能够再训练集上获得足够低的「训练误差」,往往由于特征维度过少,导致拟合的函数无法满足训练集,导致误差较大。 过拟合指的是模型训练误差与测试误差之间差距过大;具体来说就是模型在训练集上训练过度,导致泛化能力过差。 「所有为了减少测试误差 阅读全文
posted @ 2020-04-13 20:02 飒白 阅读(367) 评论(0) 推荐(0) 编辑
摘要: Q1 数据预处理主要包括什么 「无量纲化」 无量纲化主要解决数据的「量纲不同」的问题,使不同的数据转换到「同一」规格,常见的方法有「标准化」和「区间缩放法」。标准化的假设前提是特征值服从「正态分布」。区间放缩法利用了「边界值」信息,将特征的取值区间缩放到某个「特点」的范围,列如[0,1]等。 (1) 阅读全文
posted @ 2020-04-13 11:09 飒白 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 常用的性能度量指标有:「精确率」、「召回率」、「F1」、「TPR」、「FPR」。 预测为真 预测为假 真实为真 TP(true positive) FN(false negative) 真实为假 FP(false positive) TN(true negative) 「精确率」Precision= 阅读全文
posted @ 2020-04-13 11:07 飒白 阅读(519) 评论(0) 推荐(0) 编辑
摘要: 1)「均方误差」 是反映估计值与被估计量之间差异程度的一种度量。 2)「RMSE均方根误差」 观测值与真值偏差的平方和与观测次数m比值的平方根,用来衡量观测值同真值之间的偏差。 3)「SSE和方误差」 4)「MAE」 直接计算模型输出与真实值之间的平均绝对误差 5)「MAPE」 不仅考虑预测值与真实 阅读全文
posted @ 2020-04-13 11:06 飒白 阅读(435) 评论(0) 推荐(0) 编辑
摘要: Q1 机器学习如何分类 按照任务类型可分为: 「回归模型」:例如预测明天的股价。「分类模型」:将样本分为两类或者多类。「结构化学习模型」:输出的不是向量而是其他「结构。」 按照学习理论可分为: 「监督学习」:学习的样本「全部」具有标签,训练网络得到一个最优模型。「无监督学习」:训练的样本「全部」无标 阅读全文
posted @ 2020-04-13 10:59 飒白 阅读(195) 评论(0) 推荐(0) 编辑