jasonfreak

一个懒惰的人,总是想设计更智能的程序来避免做重复性工作

2016年4月29日 #

使用Python进行描述性统计

摘要: 目录 1 描述性统计是什么?2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值、中位数、众数) 2.3 发散程度(极差,方差、标准差、变异系数) 2.4 偏差程度(z-分数) 2.5 相关程度(协方差,相关系数) 2.6 回顾3 使用Matplotlib进行图分析 阅读全文

posted @ 2016-04-29 21:08 jasonfreak 阅读(125657) 评论(4) 推荐(12) 编辑

2016年4月17日 #

马踏飞燕——奔跑在Docker上的Spark

摘要: 目录 1 为什么要在Docker上搭建Spark集群 他:为什么要在Docker上搭建Spark集群啊? 我:因为……我行啊! MR和Spark都提供了local模式,即在单机上模拟多计算节点来执行任务。但是,像我这等手贱的新手,怎么会满足于“模拟”?很容易想到在单机上运行多个虚拟机作为计算节点,可 阅读全文

posted @ 2016-04-17 12:44 jasonfreak 阅读(27872) 评论(4) 推荐(4) 编辑

导航