随笔分类 - 数据分析之流
摘要:在平常的工作中,经常会有一些马虎的数据分析师,接到业务方提到的需求后,大致扫一遍然后就吭叽吭叽做起来,最后出的分析结果报告交给业务方后没多久就打回来,说不是他想要结果,仔细一讨论发现双方的指标定义不一致,从而导致了一顿白忙活,造成“十动仍拒”的下场。所以指标定义的清晰性是开始分析工作的前提。OK,本文要讲述的也是有关指标定义,是由talking data推出的移动游戏运营数据分析指标白皮书,目的是统一移动游戏数据指标的定义,主要涉及宏观层面的定义,下面分模块来看一,用户获取日新登用户数(daily new users)定义:每日注册并登陆游戏的用户数解决的问题:1)渠道贡献新用户份额 (...
阅读全文
摘要:本篇主要做的是一个流失预警模型实时查询的一个测试,需求描述:用户名单请求判断是否流失,秒级内返回判断结果。操作场景如下: 流失预警模型,预测用户是否在未来一段时间内流失(牵涉到流失定义,用户活跃度定义,用户行为时间定义等)建立,用到了用户最近行为特征、行为趋势特征等,最后预测是否流失(1流失,0留存)。在本文的测试之前已经把模型建好。实验条件:ubuntu13.04 32位,mysql,mysqldb,scikit-learn1.4安装Mysqlsudo apt-get install mysql-client-core-5.5sudo apt-get install mysql-server
阅读全文
摘要:【数据分析注意点】1、要注意每种统计分析方法的适用范围;2、使用不同的数据分析方法对同一问题进行解释,来互相验证结论的真伪,多次尝试;3、结果要使用通俗易懂的语言或图表进行描述;4、需要耐心和细致,不能出现任何疏漏,别一个老鼠害一锅汤;5、高级数据分析不一定是最好的,简单有效才是最好
阅读全文

浙公网安备 33010602011771号