摘要: 简单的分类算法 朴素贝叶斯分类算法 求解先验概率:C为一个类别集合, c i c_i ci​是第i个类别,求解概率 P ( c i ) P(c_i) P(ci​) 求解类别条件概率:x为一个待分类项, a k a_k ak​是x的第k个特征属性,假设这些属性相互独立 P ( x ∣ c i ) = 阅读全文
posted @ 2022-10-27 12:04 chanxe 阅读(63) 评论(0) 推荐(0)
摘要: 数据预处理 数据清洗 缺失值处理 缺失值是一种典型的数据不完备情况 处理方法 丢弃整个样本 存在缺失值的样本在样本集的比例不大时有效可能导致过拟合 用特殊值表示缺失 使用属性统计进行填充 数值型使用平均值,非数值型使用众数 已知属性的值去预测 分配所有可能的值 离群值检测 离群值是指那些与大多数样本 阅读全文
posted @ 2022-10-27 09:21 chanxe 阅读(42) 评论(0) 推荐(0)