摘要: sklearn.svc 参数 sklearn中的SVC函数是基于libsvm实现的,所以在参数设置上有很多相似的地方。(PS: libsvm中的二次规划问题的解决算法是SMO)。 对于SVC函数的参数解释如下:(主要翻译的sklearn 文档) C: float参数 默认值为1.0 错误项的惩罚系数 阅读全文
posted @ 2019-07-12 20:25 仝渊涛 阅读(1764) 评论(0) 推荐(0) 编辑
摘要: k-近邻算法 k-近邻算法(kNN),它的工作原理是:存在一个样本数 据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据 与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的 特征进行比较,然后算法提取样本集中特征最相似数据(最近邻) 阅读全文
posted @ 2019-07-12 17:23 仝渊涛 阅读(211) 评论(0) 推荐(0) 编辑
摘要: GridSearchCV,它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果。这个时候就是需要动脑筋了。数据量比较大的时候可以使用一个快速调优的方法——坐标下降。它其实是一种贪心算法:拿当前对模型影响最大的参数调优, 阅读全文
posted @ 2019-07-12 16:18 仝渊涛 阅读(4490) 评论(0) 推荐(1) 编辑