随笔分类 -  机器学习与数据分析

摘要:https://blog.csdn.net/roger_royer/article/details/78790050 分母+1是为了防止该词语在语料库中不存在,即分母为0, 倒文档频率又称为逆文档频率,它是文档频率的倒数,主要用于降低所有文档中一些常见却对文档影响不大的词语的作用。 结果分析: ar 阅读全文
posted @ 2019-12-27 23:41 JasonPeng1
摘要:误差原因 我们已讨论了一些用于测量模型性能的基本指标,现在来关注一下模型起初为何会出现误差。 在模型预测中,模型可能出现的误差来自两个主要来源,即:因模型无法表示基本数据的复杂度而造成的偏差(bias),或者因模型对训练它所用的有限数据过度敏感而造成的方差(variance)。我们会对两者进行更详细 阅读全文
posted @ 2019-12-27 23:36 JasonPeng1