摘要: 一句话描述:在特征条件独立的情况下,学习(X,Y)的联合概率分布,给定新的X,计算后验概率最大的Y作为其输出。 基本方法 前提假设: 条件独立假设指用于分类的特征在类确定的情况下是条件独立的。 用于分类的特征的分布不受类别变量的影响。 用于分类的特征向量均为布尔型随机变量。 过程: 利用训练数据估计 阅读全文
posted @ 2020-11-25 22:57 unuliha 阅读(177) 评论(0) 推荐(0)
摘要: 模型选择的目的是使学到的模型对已知数据和未知数据都有较好的预测能力,同时又要避免过拟合。所考察的指标主要是模型的训练误差及测试误差,模型的复杂度越高,训练误差越小,但测试误差先减小后增大。 训练误差和测试误差随模型复杂度变化趋势 过拟合是指模型的复杂度比真模型更高,模型选择就是选择测试误差最小的适当 阅读全文
posted @ 2020-11-25 21:12 unuliha 阅读(537) 评论(0) 推荐(0)