摘要:Q1 过拟合与欠拟合的区别是什么,什么是正则化 欠拟合指的是模型不能够再训练集上获得足够低的「训练误差」,往往由于特征维度过少,导致拟合的函数无法满足训练集,导致误差较大。 过拟合指的是模型训练误差与测试误差之间差距过大;具体来说就是模型在训练集上训练过度,导致泛化能力过差。 「所有为了减少测试误差 阅读全文
posted @ 2020-04-13 20:02 飒白 阅读(142) 评论(0) 推荐(0) 编辑
摘要:Q1 数据预处理主要包括什么 「无量纲化」 无量纲化主要解决数据的「量纲不同」的问题,使不同的数据转换到「同一」规格,常见的方法有「标准化」和「区间缩放法」。标准化的假设前提是特征值服从「正态分布」。区间放缩法利用了「边界值」信息,将特征的取值区间缩放到某个「特点」的范围,列如[0,1]等。 (1) 阅读全文
posted @ 2020-04-13 11:09 飒白 阅读(104) 评论(0) 推荐(0) 编辑
摘要:常用的性能度量指标有:「精确率」、「召回率」、「F1」、「TPR」、「FPR」。 预测为真 预测为假 真实为真 TP(true positive) FN(false negative) 真实为假 FP(false positive) TN(true negative) 「精确率」Precision= 阅读全文
posted @ 2020-04-13 11:07 飒白 阅读(263) 评论(0) 推荐(0) 编辑
摘要:1)「均方误差」 是反映估计值与被估计量之间差异程度的一种度量。 2)「RMSE均方根误差」 观测值与真值偏差的平方和与观测次数m比值的平方根,用来衡量观测值同真值之间的偏差。 3)「SSE和方误差」 4)「MAE」 直接计算模型输出与真实值之间的平均绝对误差 5)「MAPE」 不仅考虑预测值与真实 阅读全文
posted @ 2020-04-13 11:06 飒白 阅读(213) 评论(0) 推荐(0) 编辑
摘要:Q1 机器学习如何分类 按照任务类型可分为: 「回归模型」:例如预测明天的股价。「分类模型」:将样本分为两类或者多类。「结构化学习模型」:输出的不是向量而是其他「结构。」 按照学习理论可分为: 「监督学习」:学习的样本「全部」具有标签,训练网络得到一个最优模型。「无监督学习」:训练的样本「全部」无标 阅读全文
posted @ 2020-04-13 10:59 飒白 阅读(108) 评论(0) 推荐(0) 编辑
摘要:2.1 基本概念 2.1.1 物理层概念 物理层解决如何在连接各种计算机的传输媒体上「传输数据比特流」,而不是指具体的传输媒体。 物理层主要任务:确定与传输媒体「接口」有关的一些特性(定义标准) 「机械特性」:定义物理连接的特性,规定物理连接时所采用的规格、接口形状、「引线数目、引脚数量」和排列情况 阅读全文
posted @ 2020-04-12 11:54 飒白 阅读(210) 评论(0) 推荐(0) 编辑
摘要:最近整理文章,发现以前的post都是随便命名的如图: 这不行啊,既不美观又不方便,所以我决定要将文件夹重命名。 第一步:批量简易重命名 因为我发现文件的命名毫无章法,所以第一步先全选然后F2,就可以一键改名了 然后按一下enter: 当然这样的文件还不能满足我们。 我们新建一个xlsx,然后根据命名 阅读全文
posted @ 2020-04-11 18:22 飒白 阅读(485) 评论(0) 推荐(0) 编辑
摘要:王道计算机考研第一章部分,包含组成·功能·分类、速率相关的性能指标、时延、时延带宽积、RTT和利用率、分层结构、协议、接口、服务、OSI参考模型等…… 阅读全文
posted @ 2020-04-03 11:24 飒白 阅读(226) 评论(0) 推荐(1) 编辑