机器学习 - 文章分类 - 言非

模型选择与调优

摘要：返回我的研究方向(Research Interests) 交叉验证为了让被评估的模型更加准确可信交叉验证：将拿到的训练数据，分为训练和验证集。以下图为例:将数据分成5份，其中一份作为验证集。然后经过4次(组)的测试，每次都更换不同的验证集。即得到4组模型的结果，取平均值作为最终结果。又称4折阅读全文

posted @ 2021-04-19 22:01 言非阅读(143) 评论(0) 推荐(0)

分类模型评估

摘要：返回我的研究方向(Research Interests) 混淆矩阵在分类任务下，预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合，构成混淆矩阵(适用于多分类) 精确率(Precision)、召回率(Recall)和F1-score 阅读全文

posted @ 2021-04-19 21:40 言非阅读(78) 评论(0) 推荐(0)

朴素贝叶斯算法（NaïveBayes）

摘要：返回我的研究方向(Research Interests) 联合概率和条件概率联合概率包含多个条件，且所有条件同时成立的概率记作:P(A,B) \[ P(A, B)= P(A)P(B) \] 条件概率就是事件A在另外一个事件B已经发生条件下的发生概率记作:P(A|B) \[ P(A1,A2 阅读全文

posted @ 2021-04-19 20:50 言非阅读(498) 评论(0) 推荐(0)

K-近邻算法（KNN）

摘要：返回我的研究方向(Research Interests) K-近邻算法(k-Nearest Neighbor，KNN) 定义与理解定义：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。来源:KNN算法最早是由Cover和Hart 阅读全文

posted @ 2021-04-19 18:28 言非阅读(613) 评论(0) 推荐(0)

数据降维-主成分分析(PCA)

摘要：返回我的研究方向(Research Interests) 什么数据降维数据降维可以理解为，从大量的特征中，选择比较有代表性的特征，从而在保证不丢失整体数据的特征的情况下，减少计算量。即数据的特征数量减少。多少个特征值【多少列】称为多少个维度数据类型离散型数据: 由记录不同类别个体的数目所得到阅读全文

posted @ 2021-04-18 19:43 言非阅读(963) 评论(0) 推荐(0)

特征处理—归一化(Normalization)—标准化(Standardization)

摘要：返回我的研究方向(Research Interests) 什么是特征处理通过特定的统计方法（数学方法）将数据转换成算法要求的数据数值型数据归一化标准化缺失值类别型数据：one-hot编码时间类型：时间的切分归一化(Normalization) 目的使得某一个特征对最终的结阅读全文

posted @ 2021-04-16 23:17 言非阅读(9304) 评论(0) 推荐(0)

Loading

言非の博客

机器学习、复杂网络

文章分类 - 机器学习

公告