摘要: 这里的预测(响应、分类)模型包括流失预警模型、付费预测模型、续费预测模型、运营活动响应模型等。 预测(响应、分类)模型是数据挖掘中最常用的一种模型类型,几乎成了数据挖掘技术应用的一个主要代名词。很多书籍介绍到数据挖掘的技术和应用,首先都会列举预测(响应、分类)模型,主要的原因可能是响应模型的核心就是 阅读全文
posted @ 2016-11-08 10:37 成为数据分析熟手 阅读(4104) 评论(0) 推荐(0) 编辑
摘要: 在python中,默认情况下是无法显示中文的,如下代码: [python] view plain copy import matplotlib.pyplot as plt # 定义文本框和箭头格式 decisionNode = dict(boxstyle = "sawtooth", fc = "0. 阅读全文
posted @ 2017-04-16 14:00 成为数据分析熟手 阅读(7199) 评论(0) 推荐(1) 编辑
摘要: 之前在网上找相关的资料,给出的方法都不合适, 经过很长时间的试错才知道源于python2.X和python3.X的不同, 原理都是采用map函数,但是二者返回的信息不同 Python2.x,可以使用map函数 ? 1 numbers = map(int, numbers) ? 1 numbers = 阅读全文
posted @ 2017-04-16 12:20 成为数据分析熟手 阅读(34426) 评论(0) 推荐(1) 编辑
摘要: 月初开始入职公司实习,很多基础内容都还没有仔细的整理,今天先写个记录,方便后面整理: 1、windows安装anaconda 链接:http://blog.csdn.net/qq_26898461/article/details/51488326 2、Windows安装python的程序包 http 阅读全文
posted @ 2017-04-15 20:27 成为数据分析熟手 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 最近在找降维的解决方案中,发现了下面的思路,后面可以按照这思路进行尝试下: 链接:http://www.36dsj.com/archives/26723 引言 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x->y, 阅读全文
posted @ 2017-03-17 13:29 成为数据分析熟手 阅读(539) 评论(0) 推荐(0) 编辑
摘要: 初面: 面试官问的比较详细,对着简历上的内容逐个进行提问, 其中涉及到的知识点主要包括SVM如何如何预测时间序列,以及K-mean聚类问题如何解决人为规定某两个物体强行归为一类的问题, 以及简单的涉及随机森林的知识点,以及随机森林都有哪些参数,如何调参的思路; 面试的特点也是集中在生物这一方面(聚类 阅读全文
posted @ 2016-11-20 20:09 成为数据分析熟手 阅读(1078) 评论(0) 推荐(0) 编辑
摘要: 【面试思路拓展】 对时间序列进行预测的方法有很多, 但如果只有几周的数据,而没有很多线性的趋势、各种实际的背景该如何去预测时间序列? 或许可以尝试下利用SVM去预测时间序列,那么如何提取预测的特征呢? 传统的做法是提取1、2、3、4、5、7、9、13个单位时间的数据作为特征进行预测; 举个例子进行分 阅读全文
posted @ 2016-11-20 19:38 成为数据分析熟手 阅读(13881) 评论(0) 推荐(0) 编辑
摘要: 如果要基于Python进行开发的话,那么pycharm是个不错的选择,试用一个月以后需要激活,原文如下: 原文链接:http://blog.csdn.net/lanchunhui/article/details/51660951 安装完软件后,启动,在要求输入注册码的界面(菜单栏 ⇒ help ⇒ 阅读全文
posted @ 2016-11-20 09:59 成为数据分析熟手 阅读(4672) 评论(0) 推荐(0) 编辑
摘要: 对于任何一个游戏产品来说,用户规模都是基础中的基础。相信不少做游戏数据分析的同学们都被老板问到过这样一个问题,游戏今年有X人,你能否告诉我明年会有多少人? 由于游戏产品受到竞品(剑灵开测端游MMORPG集体滑铁卢)、外部事件(如世界杯春节)、自身运营活动(开个登陆活动活跃瞬间暴涨)等诸多因素影响,要 阅读全文
posted @ 2016-11-08 11:13 成为数据分析熟手 阅读(6442) 评论(0) 推荐(0) 编辑
摘要: 招聘职位:今日头条数据分析师(校招) 一面: 先自我介绍,然后对照简历针对性的提问, 有哪些项目经验,学到了哪些东西以及有哪些比较深刻的体会。 具体阐述下PCA的原理和内容。 业务问题,如果用户的点击率下降2个百分点,该如何分析处理? 思路:先判断这个下降是否合理,然后从各个方向头脑风暴 二面: 问 阅读全文
posted @ 2016-10-21 21:49 成为数据分析熟手 阅读(7681) 评论(0) 推荐(0) 编辑