2020 年 4月 13 日随笔档案 - 飒白

2020年4月13日

摘要： Q1 过拟合与欠拟合的区别是什么，什么是正则化欠拟合指的是模型不能够再训练集上获得足够低的「训练误差」，往往由于特征维度过少，导致拟合的函数无法满足训练集，导致误差较大。过拟合指的是模型训练误差与测试误差之间差距过大；具体来说就是模型在训练集上训练过度，导致泛化能力过差。「所有为了减少测试误差阅读全文

posted @ 2020-04-13 20:02 飒白阅读(367) 评论(0) 推荐(0) 编辑

[一起面试AI]NO.4特征工程主要包括什么？

摘要： Q1 数据预处理主要包括什么「无量纲化」无量纲化主要解决数据的「量纲不同」的问题，使不同的数据转换到「同一」规格，常见的方法有「标准化」和「区间缩放法」。标准化的假设前提是特征值服从「正态分布」。区间放缩法利用了「边界值」信息，将特征的取值区间缩放到某个「特点」的范围，列如[0,1]等。 (1) 阅读全文

posted @ 2020-04-13 11:09 飒白阅读(305) 评论(0) 推荐(0) 编辑

[一起面试AI]NO.3分类问题常用的性能度量指标有哪些

摘要：常用的性能度量指标有：「精确率」、「召回率」、「F1」、「TPR」、「FPR」。预测为真预测为假真实为真 TP(true positive) FN(false negative) 真实为假 FP(false positive) TN(true negative) 「精确率」Precision= 阅读全文

posted @ 2020-04-13 11:07 飒白阅读(519) 评论(0) 推荐(0) 编辑

[一起面试AI]NO.2回归问题常用的性能度量指标有哪些

摘要： 1)「均方误差」是反映估计值与被估计量之间差异程度的一种度量。 2)「RMSE均方根误差」观测值与真值偏差的平方和与观测次数m比值的平方根，用来衡量观测值同真值之间的偏差。 3)「SSE和方误差」 4)「MAE」直接计算模型输出与真实值之间的平均绝对误差 5)「MAPE」不仅考虑预测值与真实阅读全文

posted @ 2020-04-13 11:06 飒白阅读(435) 评论(0) 推荐(0) 编辑

[一起面试AI]NO.1机器学习简介

摘要： Q1 机器学习如何分类按照任务类型可分为：「回归模型」：例如预测明天的股价。「分类模型」：将样本分为两类或者多类。「结构化学习模型」：输出的不是向量而是其他「结构。」按照学习理论可分为：「监督学习」：学习的样本「全部」具有标签，训练网络得到一个最优模型。「无监督学习」：训练的样本「全部」无标阅读全文

posted @ 2020-04-13 10:59 飒白阅读(195) 评论(0) 推荐(0) 编辑

飒白

公告