摘要: 前言: 当掌握了大量数据时候,我们往往希望在数据中挖掘更多的信息,一般可以应用成熟模型进行比较深入的分析。 举个需求:我需要知道在一些用户购买了很多商品后,预估哪些商品同时被购买的概率大。目的是为了让用户对平台产生好的体验,更高的黏性,更高的订单量。 这种分析通常会被用到推荐模块里面,也可以计算出搭 阅读全文
posted @ 2019-08-02 11:41 codeWan 阅读(722) 评论(0) 推荐(0) 编辑
摘要: 当掌握了大量数据时候,我们往往希望在数据中挖掘更多的信息,一般可以应用成熟模型进行比较深入的分析。 举几个例子: ②上线了某个活动,预估活动效果,用户参与度情况。 ③上线某个注册送现金活动,判断哪些账号是真是账号,哪些是虚假账号(为了领取现金注册的) 我们可以根据以往活动的数据,分析活动的各个影响因 阅读全文
posted @ 2019-07-25 10:36 codeWan 阅读(458) 评论(0) 推荐(0) 编辑
摘要: 当掌握了大量数据时候,我们往往希望在数据中挖掘更多的信息,一般可以应用成熟模型进行比较深入的分析。 举几个例子: ①例如我们工作中常用的,预估下今年12月份的销量情况 预估销量情况这时候我们可以用回归分析,可以理解为一个自变量或者多个自变量通过算法运算得出因变量,例如预估12月份的销量,因变量是销量 阅读全文
posted @ 2019-07-15 15:50 codeWan 阅读(852) 评论(0) 推荐(0) 编辑
摘要: 前言: 想成为一个好的数据产品经理,不仅要有产品意识,还要有好的分析思路,因为一个数据产品需求大部分都是由分析需求固化而来的。数据产品和数据分析是分不开的。一个好的数据产品经理,只有掌握了常用的数据分析框架和方法,才能使做出来的数据产品让数据分析师和业务人员使用得更顺手、更贴近业务。在进行数据分析之 阅读全文
posted @ 2019-07-04 11:19 codeWan 阅读(349) 评论(0) 推荐(0) 编辑
摘要: 4. 工程思维: 工程思维主要关注的是项目实现的过程,包括项目的方案、项目排期、项目进度跟进、项目执行等,是一种更加关注细节逻辑、更加严谨的思维方式。比如,要开发一个数据分析平台,如果单纯用用户思维看,那么很可能只关注表面的功能,其实这只是项目中很小的一部分,还要关注系统架构选型、后端功能实现、系统 阅读全文
posted @ 2019-06-27 11:05 codeWan 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 之前的文章总结的东西都比较偏底层和技术相关。现在回归到数据产品的本质:“数据驱动业务” 分割 前言: 产品经理(任意领域的产品)在工作或行动中我觉得分为两个很重要的方面:1. 道 2.术 (先有其道,再有其术) 如果你的思维方式偏离了应有的道路,那么你的什么R语言数据挖掘, 数据分析,EX,SQL 阅读全文
posted @ 2019-06-25 14:46 codeWan 阅读(285) 评论(0) 推荐(0) 编辑
摘要: 之前漏了个很重要的东西没说明,因为我使用得不多,但是又非常重要的家伙—元数据。 元数据(Metadata),又称中介数据、中继数据,为描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能 如果你进到了公司第一时间找相关负责人那业务元数据看看,有助于你日 阅读全文
posted @ 2019-06-10 10:20 codeWan 阅读(473) 评论(0) 推荐(1) 编辑
摘要: 首先先介绍几款常见可视化产品或分析工具(好不好用需要体会才知道或者联系他们技术商务看看支持哪些功能符不符合自身情况) 1.Excel: 最常使用得工具之一,对于大部分数据分析其实足够可用了。也是本人使用最多的。 2.R语言ggplot2 ggplot2其实是R语言的可视化包,因此对于熟悉R语言的人来 阅读全文
posted @ 2019-06-03 15:05 codeWan 阅读(305) 评论(0) 推荐(0) 编辑
摘要: OLAP和BI是日常工作中比较熟悉的了,也是经常会接触到的,这里总结下。 这里先说一个概念:数据立方体 我们分析一堆数据报告时候通常这些数据报告采用二维表示,是行与列组成的二维表格。但在我们分析数据的角度很可能有多个,数据立方体可以理解为就是维度扩展后的二维表格。但更多时候数据立方体是多维的,如下图 阅读全文
posted @ 2019-05-29 17:36 codeWan 阅读(572) 评论(0) 推荐(0) 编辑
摘要: ETL这个过程可以说下整套数据流程下来最枯燥也是最耗时间的流程,但是也是最重要的。很多时候我们不缺数据,缺的是好数据,而ETL的结果则导致下游成员的数据质量。 ETL是贯穿数仓的整个环节,不是说只是在某一个地方才使用的。ETL工作的实质就是从各个数据源提取数据,对数据进行转换,并最终加载填充数据到数 阅读全文
posted @ 2019-05-14 15:56 codeWan 阅读(491) 评论(0) 推荐(0) 编辑