everda

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2019年8月8日

摘要: 一、背景 在jupyter上输入 时提示无法导入plot_tree模块。再查看tree里是否有这个模块时发现并没有。 于是想到可能是sklearn版本问题,果然是。我的sklearn是0.19.2,官网版本是0.21.3,查看0.19.2版本发现确实没有plot_tree模块。所以就涉及到查看/更新 阅读全文
posted @ 2019-08-08 19:33 everda 阅读(277) 评论(0) 推荐(0)

摘要: 一、背景 在汇报界(??)有个说法,说是只要你分一二三条去阐述,总不会太差。为什么呢?因为人家只能记着三五句话,通常有三个观点也就不错了。这就是框架的作用,即使只是一二三条这种简单的道理,它也能立即帮你把说了半天的观点更准确地传达出去,不管一二三条是并列关系、递进关系、包含关系还是压根就关系混乱。 阅读全文
posted @ 2019-08-08 18:17 everda 阅读(526) 评论(0) 推荐(0)

2019年8月6日

摘要: 一、V1.0(sklearn版) 1.1简易API 注意, 1)基于树的算法只是计算划分前后混乱度(对每个分类样本数的某种加和)变化,并不对特征进行计算。所以不需要进行标准化、独热编码等。 2)输入的特征不能是字符串型。 import pandas as pd import matplotlib.p 阅读全文
posted @ 2019-08-06 18:47 everda 阅读(394) 评论(0) 推荐(0)

摘要: 大纲 这篇文章是介绍sklearn库的使用,主要围绕sklearn官网内容进行阐述。包括三个部分的内容: 1.背景——主要介绍sklearn库是干什么的,官网内容板块是怎样的,我们主要从哪块学起; 2.框架——主要从模型使用流程角度出发,阐述sklearn主要实现的内容; 3.API——以从应用出发 阅读全文
posted @ 2019-08-06 17:22 everda 阅读(834) 评论(0) 推荐(0)

摘要: 一、原理阐述 算法类型:监督学习_分类算法 输入:数值型或标称型 V1.0 将测试集挨个按特征的特征值划分,计算划分前与划分后的混乱度之差,将差最大的特征作为第一层节点,得到被该特征的特征值划分出来几块数据。再将这几块数据分别按上面的步骤重复进行(递归过程),直到该块都是同一类或特征值用完为止。 二 阅读全文
posted @ 2019-08-06 17:11 everda 阅读(224) 评论(0) 推荐(0)

2019年7月24日

摘要: 一、背景 SQL几乎是初级分析师80%的工作内容,当然在我的规划里,中级分析师要做好维度建模工作以及最好有OLAP系统工具啥的,或者已经能主动分析写文章了,尽量减少SQL的无效使用。这是我自己的定位,其他人可能不一样。 anyway,SQL对分析师来说是一项很棒的工具。Hive是基于Hadoop的一 阅读全文
posted @ 2019-07-24 13:18 everda 阅读(1234) 评论(0) 推荐(1)

2019年7月2日

摘要: 1.记录片天地 http://www.jlpcn.net/ 里面有大量科学探索、社会生活、生态地理、文化历史相关记录片,还有BBC频道、HNK频道、CCTV频道等相对系统的栏目。不想思维淹没在零碎的信息上,可以抽个大块时间看个记录片。 类似的有纪录片之家http://www.jlpdq.com/ 2 阅读全文
posted @ 2019-07-02 12:58 everda 阅读(1297) 评论(0) 推荐(0)

2019年6月28日

摘要: 一、背景 初入分析行业,可能大都围绕着DAU、留存、漏斗转化率转着。例如衡量不同产品,看DAU,看留存,看付费率,看客单价等等;例如产品有新的功能,想知道功能对产品的作用,看功能使用率,功能留存,对整体功能留存的影响等等;例如评估新的获取用户渠道,看带来的量级,各渠道新用户留存情况,付费转化率情况等 阅读全文
posted @ 2019-06-28 12:57 everda 阅读(470) 评论(0) 推荐(0)

2019年6月19日

摘要: 背景 零售业有个分析概念叫做“人货场”,说的是零售行业分析可以分为三个方面,分别是人——店长店员等,货——商品,场——各个店铺卖场。从人出发,包括人的薪资,销售能力,这是一个简单的ROI问题;从货出发,包括商品的成本、销售额、销售量、毛利,更细致的还有经过率、试穿率、试穿-购买率等,也是一个简单的R 阅读全文
posted @ 2019-06-19 14:33 everda 阅读(12226) 评论(1) 推荐(0)

2019年6月13日

摘要: 背景 作为一个坚持走数据专家路线的人,我对这个职业的不同阶段的能力和要求有一些自己的理解。这些理解可能不是市面上的硬规则,只是一个起点低的人走到目标位置的职业规划。所以看看就好,不必根究。 一、初级数据分析师 二、中级数据分析师 三、高级数据分析师 四、数据专家 阅读全文
posted @ 2019-06-13 18:35 everda 阅读(833) 评论(0) 推荐(0)