随笔分类 - 机器学习
机器学习总结与记录
摘要:使用joblib模块保存于加载模型 在机器学习的过程中,我们会进行模型的训练,最常用的就是sklearn中的库,而对于训练好的模型,我们当然是要进行保存的,不然下次需要进行预测的时候就需要重新再进行训练。如果数据量小的话,那再重新进行训练是没有问题的,但是如果数据量大的话,再重新进行训练可能会花费很
阅读全文
摘要:在现实收集的样本中,正负类别不均衡是现实数据中很常见的问题。一个分类器往往 Accuracy 将近90%,但是对少数样本的判别的 Recall 却只有10%左右。这对于我们正确找出少数类样本非常不利。 举例来说:在一波新手推荐的活动中,预测用户是否会注册的背景下,不注册的用户往往是居多的,这个正负比
阅读全文
摘要:好记性不如烂笔头,打算以博客连载的方式把最近机器学习的一些学习笔记记下来,机器学习涉及的知识点很多,时间一长很容易遗忘,写在博客上也方便自己随时查阅及复习。学习笔记偏重实用工程,尽量不涉及复杂的数学推导。 机器学习分类 -- 监督学习:训练数据中带有标记(分类、回归); -- 无监督学习:训练数据中
阅读全文
摘要:Bagging 思想: Bagging 思想: 思想: Bagging就是通过M个弱模型的结果,通过并行集成的方式来获得最终结果。因为M个数据集是相互独立的,因此这M个弱模型之间也是相互独立的,在最终的集成结果时,每个模型的权重是一样的。这是和Boosting所不同的。 集成方式: 回归问题 M个模
阅读全文
摘要:机器学习算法: 机器学习理论基础学习1——频率派 VS 贝叶斯派 机器学习理论基础学习2——线性回归 机器学习理论基础学习3.1 Linear classification 线性分类之感知机PLA(Percetron Learning Algorithm) 机器学习理论基础学习3.2 Linear
阅读全文
摘要:一.问题建模 1.评价指标 1.1分类指标 二分类 精确率 P=TP/(TP+FP) 召回率 R=TP/(TP+FN) F1值 2PR/(P+R) P-R曲线 横轴是召回率0-1,纵轴为对应的召回率下的精确率 ROC曲线 横轴为假正率FPF=FP/(FP+TN),纵轴为真正率TPR=TP/(TP+F
阅读全文

浙公网安备 33010602011771号