08 2017 档案

摘要:PHP异步执行的常用方式常见的有以下几种,可以根据各自优缺点进行选择: 1.客户端页面采用AJAX技术请求服务器优点:最简单,也最快,就是在返回给客户端的HTML代码中,嵌入AJAX调用,或者,嵌入一个img标签,src指向要执行的耗时脚本。缺点:一般来说Ajax都应该在onLoad以后触发,也就是 阅读全文
posted @ 2017-08-08 23:16 icefox89 阅读(383) 评论(0) 推荐(0)
摘要:MySQL在2016年仍然保持强劲的数据库流行度增长趋势。越来越多的客户将自己的应用建立在MySQL数据库之上,甚至是从Oracle迁移到MySQL上来。但也存在部分客户在使用MySQL数据库的过程中遇到一些比如响应时间慢,CPU打满等情况。现将《ApsaraDB专家诊断报告》中出现的部分常见SQL 阅读全文
posted @ 2017-08-06 18:33 icefox89 阅读(137) 评论(0) 推荐(0)
摘要:今天聊一下增长黑客。 增长黑客是近年来国外很火热的一个词汇,顾名思义,它负责和驱动一切业务指标的增长。和运营平时干的事情没啥区别,只是多了一个非常酷炫的黑客后缀。 更多的含义和内容,在「增长黑客」这本书已经谈到,今天聊的是我业务中的一些增长案例。 我认为,增长黑客更见于细节和洞察,而不是爆发性的营销 阅读全文
posted @ 2017-08-06 17:08 icefox89 阅读(161) 评论(0) 推荐(0)
摘要:今天用Python分析用户消费行为,内容会更接地气,难度会稍稍上升一点。它也是七周成为数据分析师的最后一篇教程了。这里会串联以前的几个知识点。 数据来源CDNow网站的用户购买明细。一共有用户ID,购买日期,购买数量,购买金额四个字段。我们通过案例数据完成一份基础的数据分析报告。 加载包和数据,文件 阅读全文
posted @ 2017-08-06 16:29 icefox89 阅读(318) 评论(0) 推荐(0)
摘要:今天开始进入Python数据分析工具的教程。 数据分析绝对绕不过的三个包是numpy、scipy和pandas。numpy是Python的数值计算扩展,专门用来处理矩阵,它的运算效率比列表更高效。scipy是基于numpy的科学计算包,包括统计、线性代数等工具。pandas是基于numpy的数据分析 阅读全文
posted @ 2017-08-06 16:27 icefox89 阅读(132) 评论(0) 推荐(0)
摘要:大家学习Python,不练习怎么行? 这次依旧使用网络抓取的数据分析师的招聘薪资作为练习数据。在早期我们已经用它进行了Excel、BI可视化、SQL三方面的实战训练,想必大家已经很熟悉了,我不再赘述。 主要内容是进行数据读取,数据概述,数据清洗和整理,分析和可视化。按照本教程,相信大家的Pandas 阅读全文
posted @ 2017-08-06 16:27 icefox89 阅读(164) 评论(0) 推荐(0)
摘要:Python之所以灵活,就是因为它函数式编程的特性。今天开始学习Python的一些高级特性。 控制流 Python等程序语言,都是从程序顶端从上到下一行行执行语句,可以把它想象成线性。生活中的很多情况,并不只是单一的线性。 某程序员的老婆叫他上街买几个桃子,吩咐如果有西瓜,买一个。 后来他就真的只买 阅读全文
posted @ 2017-08-06 16:26 icefox89 阅读(113) 评论(0) 推荐(0)
摘要:Python一共有三大数据结构,它是Python进行数据分析的基础,分别是tuple元组,list数组以及dict字典。本文通过这三者的学习,打下数据分析的基础。 数组 数组是一个有序的集合,他用方括号表示。 num就是一个典型的数组。数组不限定其中的数据类型,可以是整数也可以是字符串,或者是混合型 阅读全文
posted @ 2017-08-06 16:25 icefox89 阅读(147) 评论(0) 推荐(0)
摘要:Python是近年来最火爆的语言,已经作为数据分析和机器学习的首选语言之一。 Python虽然被诟病不够快,但足够灵活和易上手。Python教程主要围绕数据分析展开,所以技术原理这类内容会略过,可以认为这是一篇重应用的课程。 想学会一门语言不是一朝一夕的事情,若大家想成为技术型的数据分析师,或者未来 阅读全文
posted @ 2017-08-06 16:24 icefox89 阅读(182) 评论(0) 推荐(0)
摘要:数据分析涉及不同的业务领域,很多时候,业务的了解比数据技巧更重要。很多新人常问Python、SQL,但鲜有问业务,可后者才决定分析的成败。 业务的洞悉决定了数据分析师发展的上限,数据技巧只是逼近它。好的分析师都懂业务,也必须懂业务。 我希望通过本文,让数据新人对业务有一个大概的了解,也适用产品和运营 阅读全文
posted @ 2017-08-06 16:23 icefox89 阅读(349) 评论(0) 推荐(0)
摘要:在前一篇讲完概率分布后,我们再接再厉拿下假设检验,也就是大名鼎鼎的AB Testing。俗话说得好,再优秀的产品经理也跑不过一半AB测试。 抽样 数据分析中,虽然数据越多越齐越好,可是受限于各类因素的制约,我们并不能获取全部的数据。比如Excel的性能限制,比如数据库不支持大文件导出、或者是无法全量 阅读全文
posted @ 2017-08-06 16:22 icefox89 阅读(256) 评论(0) 推荐(0)
摘要:我们已经了解概率的基础,概率中通常将试验的结果称为随机变量。随机变量将每一个可能出现的试验结果赋予了一个数值,包含离散型随机变量和连续型随机变量。 掷硬币就是一个典型的离散型随机变量,离散随机变量可以取无限个但可数的数值。而连续变量相反,它在某一个区间内能取任意的数值。时间就是一个典型的连续变量,1 阅读全文
posted @ 2017-08-06 16:21 icefox89 阅读(246) 评论(0) 推荐(0)
摘要:概率是度量一件事发生的可能性,它是介于0到1之间的数值。 我们抛一枚硬币,它有正面朝上和反面朝上两种结果,通常用样本空间S表示,S={正面,反面}。 如果把硬币抛两次呢?它拥有四种结果,S={(正面,正面),(反面,反面),(正面,反面),(反面,正面)}。抛三次则是八种。 现实中的概率事件更复杂, 阅读全文
posted @ 2017-08-06 16:20 icefox89 阅读(470) 评论(0) 推荐(0)
摘要:描述统计学,往往研究数据的集中和离散。其中,各数据出现次数的情况,也是重要的一个研究方向。 频数分布表示互不重叠的组别中每一组项目的个数。在分类型数据中,频数分布就是各个分类类目的总数。 上图就是数据分析师的岗位,按城市统计出的频数表,即各个城市的岗位数量。从应用角度看,数据透视表是专门用来计算频数 阅读全文
posted @ 2017-08-06 16:19 icefox89 阅读(238) 评论(0) 推荐(0)
摘要:当获得一份数据集时,你会怎么做? 立马撩起袖管进行分析么?这不是一个好建议。无数的经验告诉我们,如果分析师不先行了解数据集的质量,后续的推断分析是事倍功半的。 正确的处理方法是先使用描述统计。 什么是描述统计学 它是一种综合概括数据集的方式,包括数据的加工和显示,数据集的分布特征等。它与推断统计相呼 阅读全文
posted @ 2017-08-06 16:18 icefox89 阅读(164) 评论(0) 推荐(0)
摘要:我们在上一篇《SQL,从入门到熟练》文章已经掌握了除Join外的常用语法和函数,今天会通过一系列的练习彻底掌握SQL。 我们知道,数据库由多张表组成,表与表之间可以实现关联。 上图就是一个简单的关联模型: Students.addressId = Address.id Students.id = S 阅读全文
posted @ 2017-08-06 16:17 icefox89 阅读(151) 评论(0) 推荐(0)
摘要:在《写给新人的数据库指南》,我们已经成功的安装数据库,并且导入数据,今天进入MySQL的实战练习。SQL是数据库的查询语言,语法结构简单,相信本文会让你从入门到熟练。 掌握SQL后,不论你是产品经理、运营人员或者数据分析师,都会让你分析的能力边界无限拓展。别犹豫了,赶快上车吧! 以下的语句都在Seq 阅读全文
posted @ 2017-08-06 16:16 icefox89 阅读(867) 评论(0) 推荐(0)
摘要:我们进入第四周数据库的内容,在数据分析师的职业生涯中,数据库与SQL会是他们性价比最高的技能之一。 数据库是逻辑上的概念,它是一堆互相关联的数据,放在物理实体上,是一堆写在磁盘上的文件,文件中有数据。这些最基础的数据组成了表(table),我们把它想象成一张Excel的sheet。 数据表的抽象概念 阅读全文
posted @ 2017-08-06 16:15 icefox89 阅读(150) 评论(0) 推荐(0)
摘要:曾经有人问过我,什么是数据分析思维?如果分析思维是一种结构化的体现,那么数据分析思维在它的基础上再加一个准则: 不是我觉得,而是数据证明 这是一道分水岭,“我觉得”是一种直觉化经验化的思维,工作不可能处处依赖自己的直觉,公司发展更不可能依赖于此。数据证明则是数据分析的最直接体现,它依托于数据导向型的 阅读全文
posted @ 2017-08-06 16:14 icefox89 阅读(221) 评论(0) 推荐(0)
摘要:今天学习第三周内容:如何锻炼分析思维。 很多人的分析思维都是欠缺的,可它又在数据分析过程中无比重要,甚至它不限于数据领域,在产品和运营工作中也能用到。 数据分析属于分析思维的一个子类,有专门的数据方法论。只有先养成正确的分析思维,才能使用好数据。前者是今天讲述的重点。 思维训练不同于Excel函数和 阅读全文
posted @ 2017-08-06 16:13 icefox89 阅读(883) 评论(0) 推荐(0)
摘要:我们上一篇《数据可视化:打造高端的数据报表》教大家如何制作清晰美观的报表以及相应技巧,但是报表是结果的呈现,并不是数据分析的过程。 数据分析师更多用到的报表是BI。 BI全称商业智能(Business Intelligence),在传统企业中,它是一套完整的解决方案。将企业的数据有效整合,快速制作出 阅读全文
posted @ 2017-08-06 16:12 icefox89 阅读(328) 评论(0) 推荐(0)
摘要:前一篇文章列举了常用的分析图表,今天主要围绕Excel常用的图表技巧,以及图表的设计规范展开。相信大家练习后,图表设计能力会从下图: 进化到: 数据分析师应该会设计图表和报表。这里并不是要求大家像设计师一样运用Photoshop等软件绘制,而是知道数据元素如何用图表更好的表达,将数据蕴含的信息展现出 阅读全文
posted @ 2017-08-06 16:10 icefox89 阅读(194) 评论(0) 推荐(0)
摘要:Excel的课程告一段落,今天开始第二周的内容,数据可视化阶段。 数据可视化是一个热门的概念,是分析师手中的优秀工具。好的可视化是会讲故事的,它向我们揭示了数据背后的规律。 大家对可视化的使用认知或许来源于下面这张图。虽然结构很清晰,但它更多针对Excel的图表,不够丰富。本文会结合数据分析师的使用 阅读全文
posted @ 2017-08-06 16:06 icefox89 阅读(427) 评论(0) 推荐(0)
摘要:本次讲解依然是提纲,图文部分引用自百度经验。如果有疑问或建议,可以留言给我,也可以网上搜索。内容方面照旧会补充SQL和Python。 快捷键 Excel的快捷键很多,以下主要是能提高效率。 Ctrl+方向键,对单元格光标快速移动,移动到数据边缘(空格位置)。 Ctrl+Shift+方向键,对单元格快 阅读全文
posted @ 2017-08-06 16:04 icefox89 阅读(166) 评论(0) 推荐(0)
摘要:在Excel技巧和Excel函数后,今天这篇文章讲解实战,如何运用上两篇文章的知识进行分析。内容是新手向的基础教程。 曾经有童鞋向我反应没有Excel数据练习,所以这次提供真实数据。为了更好的了解数据分析师这个岗位,我用爬虫爬取了招聘网站上约5000条的数据分析师职位数。拿数据分析师进行数据分析。 阅读全文
posted @ 2017-08-06 16:04 icefox89 阅读(156) 评论(0) 推荐(0)
摘要:世界上的数据分析师分为两类,使用Excel的分析师,和其他分析师。 每一个数据新人的入门工具都离不开Excel。因为Excel涵盖的功能足够多。 很多传统行业的数据分析师只要求掌握Excel即可,会SPSS/SAS是加分项。即使在挖掘满街走,Python不如狗的互联网数据分析界,Excel也是不可替 阅读全文
posted @ 2017-08-06 16:02 icefox89 阅读(259) 评论(0) 推荐(0)
摘要:今天简单说下数据分析的工具技巧。 IPython notebook(现在叫jupyter)一直是数据分析的利器。 我长期以来都用它玩单机版的数据分析,BI虽然在线上环境,但偏报表。最近在查询资料的时候,发现它能完美地和Docker兼容。Docker我只了解部分概念,不过并不妨碍阅读文章。 于是拜托我 阅读全文
posted @ 2017-08-06 16:01 icefox89 阅读(239) 评论(0) 推荐(0)
摘要:有一次在公司,突然一张图片在公司群里炸开。 那是一大箱的饮料,水蜜桃味的。原来一家便当O2O到公司来邀请注(shao)册(qian)。扫一扫关注微信二维码就能拿一瓶饮料,首单也有优惠。 真是运营同行见同行,两眼泪汪汪啊。 外卖公司派出了两个妹子对我司程序员实行卖萌攻势,一个产品经理负责推销和收集用户 阅读全文
posted @ 2017-08-06 16:00 icefox89 阅读(125) 评论(0) 推荐(0)