Loading

文章分类 -  机器学习

摘要:返回 我的研究方向(Research Interests) 交叉验证 为了让被评估的模型更加准确可信 交叉验证:将拿到的训练数据,分为训练和验证集。 以下图为例:将数据分成5份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果。又称4折 阅读全文
posted @ 2021-04-19 22:01 言非 阅读(119) 评论(0) 推荐(0)
摘要:返回 我的研究方向(Research Interests) 混淆矩阵 在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多分类) 精确率(Precision)、召回率(Recall)和F1-score 阅读全文
posted @ 2021-04-19 21:40 言非 阅读(62) 评论(0) 推荐(0)
摘要:返回 我的研究方向(Research Interests) 联合概率和条件概率 联合概率 包含多个条件,且所有条件同时成立的概率 记作:P(A,B) \[ P(A, B)= P(A)P(B) \] 条件概率 就是事件A在另外一个事件B已经发生条件下的发生概率 记作:P(A|B) \[ P(A1,A2 阅读全文
posted @ 2021-04-19 20:50 言非 阅读(471) 评论(0) 推荐(0)
摘要:返回 我的研究方向(Research Interests) K-近邻算法(k-Nearest Neighbor,KNN) 定义与理解 定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 来源:KNN算法最早是由Cover和Hart 阅读全文
posted @ 2021-04-19 18:28 言非 阅读(591) 评论(0) 推荐(0)
摘要:返回 我的研究方向(Research Interests) 什么数据降维 数据降维可以理解为,从大量的特征中,选择比较有代表性的特征,从而在保证不丢失整体数据的特征的情况下,减少计算量。即数据的特征数量减少。多少个特征值【多少列】称为多少个维度 数据类型 离散型数据: 由记录不同类别个体的数目所得到 阅读全文
posted @ 2021-04-18 19:43 言非 阅读(915) 评论(0) 推荐(0)
摘要:返回 我的研究方向(Research Interests) 什么是特征处理 通过 特定的统计方法(数学方法)将 数据 转换成 算法要求的数据 数值型数据 归一化 标准化 缺失值 类别型数据:one-hot编码 时间类型:时间的切分 归一化(Normalization) 目的 使得某一个特征对最终的结 阅读全文
posted @ 2021-04-16 23:17 言非 阅读(9162) 评论(0) 推荐(0)