2018年8月15日

batch、随机、Mini-batch梯度下降

摘要: batch梯度下降: 随机梯度下降: Mini-batch梯度下降: 阅读全文

posted @ 2018-08-15 10:32 潇洒的麦兜 阅读(175) 评论(0) 推荐(0) 编辑

2018年8月2日

聚类算法相关

摘要: Bisecting KMeans Bisecting KMeans算法的主要思想是:首先将所有点作为一个簇,然后将该簇一分为二,之后选择能最大限度降低聚类代价函数(也就是误差平方和)的簇划分为两个簇,以此进行下去,直到簇的数目等于用户给定的数目k为止。 Gaussian Mixture Model 阅读全文

posted @ 2018-08-02 00:04 潇洒的麦兜 阅读(101) 评论(0) 推荐(0) 编辑

2018年5月6日

bias、variance与拟合之间的关系

摘要: Error = Bias^2 + Variance+Noise 误差的原因: 1.Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,即算法本身的拟合能力。 2.Variance反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。反应预测的波动情况。 3.噪声。 阅读全文

posted @ 2018-05-06 22:39 潇洒的麦兜 阅读(3437) 评论(0) 推荐(0) 编辑

2018年4月28日

特征维中词矩阵

摘要: 在处理数据的时候偶尔会遇到特征维如下情况: 可以将other维中的以分号分隔的词转化为词向量的形式: 最终得到结果: 阅读全文

posted @ 2018-04-28 17:19 潇洒的麦兜 阅读(183) 评论(0) 推荐(0) 编辑

2017年7月14日

梯度提升算法和随机森林算法思想

摘要: 在天池或者kaggle的比赛中,xgboost算法算是一大杀器,但在学习xgboost前先对gbdt和rf得有一个了解: GBDT思想:先用一个初始值来学习一棵决策树,叶子处可以得到预测的值,以及预测之后的残差,然后后面的决策树就要基于前面决策树的残差来学习,直到预测值和真实值的残差为零。最后对于测 阅读全文

posted @ 2017-07-14 10:08 潇洒的麦兜 阅读(2561) 评论(0) 推荐(0) 编辑

2017年7月11日

pandas中series求交集

摘要: 在进行数据探索的时候会遇到求交集的情况,比如说:优惠卷预测的时候,有多张表,表1有用户id,表2也有用户id,但是不能确定表1的用户有多少出现在表2当中。 un_id1,un_id2 为两个 Series 对象: un_id1 = set(un_id1)un_id2 = set(un_id2)tmp 阅读全文

posted @ 2017-07-11 11:27 潇洒的麦兜 阅读(2103) 评论(0) 推荐(0) 编辑

2017年7月7日

pandas中axis的含义

摘要: 定义一个dataframe: >>> df a b0 1 31 2 4 现在看两种用法: 1.求行的均值 >>> df.mean(axis=1)0 2.01 3.0dtype: float64 2.删除列 >>> df.drop('a',axis=1) b0 31 4 乍看不好理解,但是,记住这句话 阅读全文

posted @ 2017-07-07 11:21 潇洒的麦兜 阅读(376) 评论(0) 推荐(0) 编辑

2017年6月27日

Error: setup script specifies an absolute path

摘要: 在安装sklearn的时候,出现: error: Error: setup script specifies an absolute path: /opt/xgboost-0.47/python-package/xgboost/../../wrapper/libxgboostwrapper.so s 阅读全文

posted @ 2017-06-27 17:10 潇洒的麦兜 阅读(1490) 评论(0) 推荐(0) 编辑

2017年6月21日

centos6.5离线安装pandas

摘要: 由于笔记本跑不动很多大赛的数据,遂转至申请的虚拟机(centos6.5)中,奈何学校的虚拟机没网,就开始了离线安装pandas的道路,当中有踩了好些坑,于是便产生了这篇文章~ 首先,自带的python版本是2.6.6的,网上查查资料,替换成pyhon2.7的,原因是pandas支持python2.7 阅读全文

posted @ 2017-06-21 21:57 潇洒的麦兜 阅读(1596) 评论(0) 推荐(0) 编辑

Centos6.5离线安装gcc

摘要: 木有网的centos折腾起来简直费劲的不要不要的~ 学校的虚拟机最开始只安装了一个libgcc-4.4.7-4,然而这是不够用的,比如安装软件的时候,需要输入"./configure"就会报没有c编译环境等等。。废话不多说,直接上教程: 首先在http://rpm.pbone.net/里面搜索一系列 阅读全文

posted @ 2017-06-21 10:06 潇洒的麦兜 阅读(994) 评论(0) 推荐(0) 编辑

导航