醉月风纯
一个即将参加校招的学渣

导航

 

2018年6月14日

摘要: 对于机器学习模型,我们把他们分成基于树的模型和非基于树的模型,因为在处理他们的特征需要不同的方法。 1.数值型特征 如果一个特征的值特别大的话,那么会使得其在非树模型上占有很大的比例,所以我们通常对其做归一化处理。 Outliers:不管是对特征还是标签,异常数据对模型的鲁棒性都会带来较大的打击,所 阅读全文
posted @ 2018-06-14 22:50 醉月风纯 阅读(386) 评论(0) 推荐(0) 编辑
 

2018年6月7日

摘要: 决策树是一类常用的机器学习算法,是一种人类在面临决策问题时一种很自然的处理机制。例如,我们要判断“这是不是一个好瓜?” 1.划分选择 在上图数据集的划分过程中,关键的问题是如何选择我们在当前节点选择哪个属性进行划分。一般而言,随着划分过程不断进行,我们希望决策树的分支节点所包含的样本尽可能属于同一类 阅读全文
posted @ 2018-06-07 10:35 醉月风纯 阅读(260) 评论(0) 推荐(0) 编辑
 

2018年6月6日

摘要: "天池历届答辩" "Kaggle竞赛解决方案" "scikit learn技术专栏" "贝叶斯优化方法" "结构之法,编程之道" "苍老师的git" "wepon的git" "雪伦的博客:机器学习算法原理及实现专栏" "RDD操作,shuffle和持久化" "Kaggle Competition P 阅读全文
posted @ 2018-06-06 20:31 醉月风纯 阅读(124) 评论(0) 推荐(0) 编辑
 

2018年6月3日

摘要: 1. 多变量散点图 2. Grouped box plot 如果我们想看下一个变量中的一类是否在某个值上比另一类更高,那么我们可以用群盒图。 从图中可以看出ST的Aggression值明显是比GK高的。 3. Heatmap 热点图的优势是能一次查看许多变量之间的相关关系 4. 把高维数据点展开到二 阅读全文
posted @ 2018-06-03 21:20 醉月风纯 阅读(1425) 评论(0) 推荐(0) 编辑
 

2018年6月2日

摘要: 数据展示: 1. FacetGrid FacetGrid是一个储存我们想怎样展示信息的东西,如下所示,我们想观察位置中SK和GK的分布。 在这里我们使用map方法把数据填充到图表中 计算类别在某一特征下的分布情况 计算两个类别在某一特征下的分布情况 2. Pariplot 对应的是分类问题的pair 阅读全文
posted @ 2018-06-02 22:43 醉月风纯 阅读(359) 评论(0) 推荐(0) 编辑
 
摘要: 数据读取: Subplotting 先展示下我们在画一张图时的步骤 1. 生成一个matplotlib Figure对象 2. 生成一个matplotlib AxesSubplot 对象,然后将其赋值给Figure 3. 使用AxesSubplot方法把信息画在屏幕上 4. 将结果返回给用户 sub 阅读全文
posted @ 2018-06-02 22:16 醉月风纯 阅读(181) 评论(0) 推荐(0) 编辑
 
摘要: 数据加载: 1. Countplot 和之前的pandas绘图相比,使用countplot可以自动计算每类的数量。 2. KDE Plot KDE,是“kernel density estimate”的简称,它会使得bar plot的图形更加的平滑,可以看出每类所占的比例。 3. 散点图加直方图 两 阅读全文
posted @ 2018-06-02 21:50 醉月风纯 阅读(975) 评论(0) 推荐(0) 编辑
 
摘要: 数据加载: 1.加上颜色,尺寸,字体等 由于pandas没有给出调整Title字体大小的工具,所以我们将其转化到matplotlib上,所有在pandas上做的操作都能在matplotlib上进行,pandas相当于其简化版,下面把其还原回去,如下所示: 同样的,可以使用seaborn库对数据做进一 阅读全文
posted @ 2018-06-02 20:24 醉月风纯 阅读(134) 评论(0) 推荐(0) 编辑
 
摘要: 数据加载: 1.散点图 上图使用下采样的方法选取了100个样本点,因为把所有的数据加载进来太多了。 2.Hexplot图 上图是一个散点图再加上热力标注的形式,可以更准确的帮助我们看出数据集中在哪些区域。 3.层叠图 上图是制作过程是首先选择一个特征,然后求 其他的特征在该特征变化下的变化趋势 ,极 阅读全文
posted @ 2018-06-02 19:45 醉月风纯 阅读(126) 评论(0) 推荐(0) 编辑
 
摘要: 数据加载与展示: 1. 类别数据的Bar图 1.1 每一类对应有多少个 1.2 每类数量占整体的比值 1.3 对X轴进行排序 阅读全文
posted @ 2018-06-02 16:29 醉月风纯 阅读(81) 评论(0) 推荐(0) 编辑