2019年11月2日

样本不平衡的处理

摘要: 分类问题的一个underlying assumption是各个类别的数据都有自己的分布,当某类数据少到难以观察结构的时候,我们可以考虑抛弃该类数据,转而学习更为明显的多数类模式,而后将不符合多数类模式的样本判断为异常/少数类,某些时候会有更好的效果。此时该问题退化为异常检测(anomaly dete 阅读全文

posted @ 2019-11-02 18:12 limingqi 阅读(2417) 评论(0) 推荐(0)

2019年10月31日

softmax推导以及多分类的应用

摘要: 阅读全文

posted @ 2019-10-31 22:51 limingqi 阅读(194) 评论(0) 推荐(0)

中心极限定理,大数极限定理

摘要: 阅读全文

posted @ 2019-10-31 22:48 limingqi 阅读(231) 评论(0) 推荐(0)

2019年10月27日

pearson相关系数的介绍

摘要: 阅读全文

posted @ 2019-10-27 10:33 limingqi 阅读(566) 评论(0) 推荐(0)

2019年10月23日

sklearn.metrics中的评估方法介绍(accuracy_score, recall_score, roc_curve, roc_auc_score, confusion_matrix)

摘要: 1 accuracy_score:分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解,但是它不能告诉你响应值的潜在分布,并且它也不能告诉你分类器犯错的类型。常常误导初学者:呵呵。 sklearn.metrics.accuracy_score(y_true, y_pre 阅读全文

posted @ 2019-10-23 22:47 limingqi 阅读(11370) 评论(0) 推荐(0)

gbdt在回归方面的基本原理以及实例并且可以做分类

摘要: 对书法的热爱,和编译器打数学公式很艰难,就这样的正例自己学过的东西,明天更新gbdt在分类方面的应用。 结论,如果要用一个常量来预测y,用log(sum(y)/sum(1-y))是一个最佳的选择。 本人理解:多分类变成多个二分类,比如说当前类别A,训练集的标签为属于A的为1,其他为0,该值为连续值( 阅读全文

posted @ 2019-10-23 16:10 limingqi 阅读(902) 评论(0) 推荐(0)

2019年10月22日

贝叶斯算法以及实现

摘要: 阅读全文

posted @ 2019-10-22 21:09 limingqi 阅读(304) 评论(0) 推荐(0)

单纯形法

摘要: 单纯形法基本部分构成:确定初始基本可行解,判别当前基本可行解是否是最优解,从一个基本可行解转化到相邻且改善了基本可行解。 阅读全文

posted @ 2019-10-22 14:06 limingqi 阅读(481) 评论(0) 推荐(0)

2019年10月21日

线性规划

摘要: 一般分为两类问题:1 是如何合理地使用有限的劳动力,设备,资金等资源,获得最大的利润。2 为了达到某一个目标,应该如何组织生产,或者安排生产工艺流程,使得消耗资源最小。线性规划的条件:决策变量,目标函数,约束条件。 min z = Σcx(j个变量) s.t Σax(j)=b x(j) >=0 其中 阅读全文

posted @ 2019-10-21 20:26 limingqi 阅读(540) 评论(0) 推荐(0)

2019年10月14日

堆排序算法以及python实现

摘要: 堆满足的条件:1,是一颗完全二叉树。2,大根堆:父节点大于各个孩子节点。每个节点都满足这个道理。小根堆同理。 parent = (i-1)/2 #i为当前节点 left = 2*i+1 right = 2*i + 2 堆可以分为大根堆和小根堆,这里用大根堆的情况来定义操作:(1)大根堆调整(max_ 阅读全文

posted @ 2019-10-14 16:07 limingqi 阅读(1145) 评论(0) 推荐(0)

导航