04 2015 档案
摘要:浏览了一些相关的论坛,将几大工具的特点分别总结下:Python(x,y) 更新很慢,稳定性一般,默认带有很多包。WinPython 只能在windows上跑,界面友好,和Python(x,y)是一个贡献者,更新较多。比较好的是anaconda,可以很快安装Linux系统里面,Anaconda安装、更...
阅读全文
摘要:职业生涯很长,对企业而言,它需要你成为一个专才,但从职业发展来看,你需要成为一个全才,方能适应社会的变化。阻碍你成为全才的不良习惯有很多,有时候我们喜欢趋利避害,拖延症更是让自己定下来的目标难以实现。从现在起,你要努力去寻找各种让自己变得不舒服的环境、习惯,别害怕痛苦,伴随着痛苦的出现,才会有成长的...
阅读全文
摘要:百度不支持用tornado请求,可以用美团开放API 测试。 1 import tornado.httpclient 2 3 def fetch(url): 4 http_header={'User-Agent':'Chrome'} 5 http_request=tornado.httpclien...
阅读全文
摘要:R语言的使用,很大程度上是借助各种各样的R包的辅助,从某种程度上讲,R包就是针对于R的插件,不同的插件满足不同的需求,截至2013年3月6日,CRAN已经收录了各类包4338个。一、 R语言包的安装1、通过选择菜单:程序包->安装程序包->在弹出的对话框中,选择你要安装的包,然后确定。2、使用命令i...
阅读全文
摘要:进入互联网的朋友们和身为互联网业内人士,你们知道有多少专业术吗?有时候专业术语也是一种逼格。商业需求文档,市场需求文档,产品需求文档,功能详细说明文档,华丽丽的各种文档你知道吗?用户体验,用户界面,用户生产内容,你知道吗?做互联网的就是上知技术,下知用户,hold程序猿,唬得住用户,各种专业术语让你...
阅读全文
摘要:作者:毛波,阿里巴巴资深数据专家,阿里数据管理平台(DMP)产品负责人。摘要:回顾传统数据仓库、商业智能到大型分布式数据平台的进化历程,深入阐述阿里的数据发展历史和数据观,以阿里DMP平台为例深入剖析全息大数据平台的构建与应用;此次分享还将从数据视角解读隐私与安全、滴滴快的打车软件之争、互联网金融等...
阅读全文
摘要:最近了做网站分析,参考了一些资料,这几个指标不错。一、网站分析的内容指标转换率 Take Rates (Conversions Rates)计算公式:转换率=进行了相应的动作的访问量/总访问量指标意义:衡量网站内容对访问者的吸引程度以及网站的宣传效果指标用法:当你在不同的地方测试新闻订阅、下载链接或...
阅读全文
摘要:人们眼中的天才之所以卓越非凡,并非天资超人一等,而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。“”他将此称为“一万小时定律”。要成为某个领域的专家,需要10000小时,按比例计算就是:如果每天工作八个小时,一周工作五天,那么成为一个领域的专家至少需要五年。这就是一万小时定...
阅读全文
摘要:番茄工作法是简单易行的时间管理方法,是由弗朗西斯科·西里洛于1992年创立的一种相对于GTD更微观的时间管理方法。使用番茄工作法,选择一个待完成的任务,将番茄时间设为25分钟,专注工作,中途不允许做任何与该任务无关的事,直到番茄时钟响起,然后在纸上画一个X短暂休息一下(5分钟就行),每4个番茄时段多...
阅读全文
摘要:一. 安装pandas1. Anaconda 安装pandas、Python和SciPy最简单的方式是用Anaconda。Anaconda是关于Python数据分析和科学计算的分发包。2. Miniconda 使用Anaconda会安装一百多个依赖包,如果想灵活控制安装的依赖包或带宽有限,使用Min...
阅读全文
摘要:原文作者:新浪微博@王小科科科本文由36大数据翻译组-大海翻译,转载必须获得本站、原作者、译者的同意,拒绝任何不表明译者及来源的转载!如何提高推荐算法的有效性?主要的方法是特征转化,模型选取,数据处理等等。降维是特征加工中的一个重要部分。这篇博文主要讲述如何利用降维方法来提高以用户为基础的协同过滤方...
阅读全文
摘要:ps: 转自2014-11-04 数据海洋BI临时需求处理规范及文档管理内容一、目的规范BI处理的临时需求。便于部门同事了解业务以及借鉴。二、临时需求的定义由业务部门向BI提出的一次性数据需求。主要用亍解决业务方某个点的问题。三、文档的内容在临时需求处理完成后,完成以下内容,放入到共享文件夹中。各个...
阅读全文
摘要:转载:http://bbs.pinggu.org/thread-3078817-1-1.html有人说Python和R的区别是显而易见的,因为R是针对统计的,python是给程序员设计的,其实这话对Python多多少少有些不公平。2012年的时候我们说R是学术界的主流,但是现在Python正在慢慢取...
阅读全文
摘要:转载:http://ices01.sinaapp.com/?p=129 R(又称R语言)是一款开源的跨平台的数值统计和数值图形化展现 工具。通俗点说,R是用来做统计和画图的。R拥有自己的脚本语言和大量的统计、图形库(得益于开源社区),这让她看起来既美又实用。与其他同类软件(如 SPSS)相比,R的...
阅读全文
摘要:1. 将环境变量PATH中加入C:\python2*\Scripts 或者C:\Program Files\Python 3.5\Scripts2. 进入pip.exe所在的目录:C:\Program Files\Python 3.5\Scripts3. pip3.5 install pandasD...
阅读全文
摘要:PD(指产品经理,下同)本身就是在做牛做马,关系圈异常复杂。数据PD也不例外。而且打交道的人更多。以下是我用PPT绘制的数据产品经理关系圈。 科普: PD:对于WEB产品设计人员而言,它的意思是“产品设计人员”,即produce designer。 PD:在IT企业中,一般是Product D...
阅读全文
摘要:回归分析是研究两种或两种以上变量之间相互依赖的定量关系的统计分析方法,在很多行业都有广泛的应用。无论是银行、保险、电信等服务行业的业务分析人员在进行数据库营销、欺诈风险侦测,还是半导体、电子、化工、医药、钢铁等制造行业的研发技术人员在进行新产品实验设计与分析、流程优化与过程监控,或者更广义地说,不同...
阅读全文
摘要:2015-04-05数据海洋营销预测模型的目标变量很多为一种状态或类型,如客户“买”还是“不买”、客户选择上网方式为 “宽带”还是“拨号”、营销战通道是邮件、电话、还是网络。我们把这类问题统称为 “分类”。决策树和逻辑回归都是解决“分类”问题的高手。用不同的算法解答同样的问题,自然引出了两者孰优孰劣...
阅读全文
摘要:线性回归简介如下图所示,如果把自变量(也叫independent variable)和因变量(也叫dependent variable)画在二维坐标上,则每条记录对应一个点。线性回规最常见的应用场景则是用一条直线去拟和已知的点,并对给定的x值预测其y值。而我们要做的就是找出一条合适的曲线,也就是找出...
阅读全文
摘要:熟悉python语言, 以及学会python的编码方式. 熟悉python库, 遇到开发任务的时候知道如何去找对应的模块. 知道如何查找和获取第三方的python库, 以应付开发任务. 学习步骤安装开发环境如果你在window下, 去下载pythonxy安装起来, 然后运行python, 进入pyt...
阅读全文
摘要:从lovedata.cn 上看到这篇文章,如果你做了5年左右的数据分析师,相信你对这篇文章应该很有感触。如果你是新人,不妨作为入门时间的指引方向。1.数据是有立场的,立场决定解读数据对于业务来讲,是KPI的衡量标杆,也是行动指南。但一旦涉及到立场和方向性的东西,必然有利益触发点的问题。比如同样的一次...
阅读全文
摘要:Python 3.x的http://www.ziqiangxuetang.com/python3/python3-stdlib.html廖雪峰的官方网站http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac927...
阅读全文
摘要:与其他一些相关工程职位一样,数据科学家的影响力与互联网同进同退。数据工程师和数据分析师与数据科学家携手共同完成这幅“大数据时代”巨作。他们共同努力拟定数据平台要求,基础和高级算法,提供数据分析和展示所需的可视化工具,并将价值创造以易于理解,富于见解的方式反馈给其他部门。三者之间的定义又是如何界定的呢...
阅读全文
摘要:从数据中看用户行为是一件很有趣的事情,了解用户行为后相应的对我们的产品设计、专题设计进行优化,就能生产更高转化率的作品。下面跟大家分享10个我们从近期手机专题数据中提炼出来的小总结,希望对大家有所帮助。1、在只有移动资源推送的情况下,手机页面访问热度持续2天。手机页面上线推广第一天是访问顶峰,第三天...
阅读全文

浙公网安备 33010602011771号