jasonfreak

一个懒惰的人,总是想设计更智能的程序来避免做重复性工作

共 2 页: 上一页 1 2

2016年4月29日 #

使用Python进行描述性统计

摘要:目录 1 描述性统计是什么?2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值、中位数、众数) 2.3 发散程度(极差,方差、标准差、变异系数) 2.4 偏差程度(z-分数) 2.5 相关程度(协方差,相关系数) 2.6 回顾3 使用Matplotlib进行图分析 阅读全文

posted @ 2016-04-29 21:08 jasonfreak 阅读 (73432) 评论 (4) 编辑

2016年4月17日 #

马踏飞燕——奔跑在Docker上的Spark

摘要:目录 1 为什么要在Docker上搭建Spark集群 他:为什么要在Docker上搭建Spark集群啊? 我:因为……我行啊! MR和Spark都提供了local模式,即在单机上模拟多计算节点来执行任务。但是,像我这等手贱的新手,怎么会满足于“模拟”?很容易想到在单机上运行多个虚拟机作为计算节点,可 阅读全文

posted @ 2016-04-17 12:44 jasonfreak 阅读 (20294) 评论 (2) 编辑

共 2 页: 上一页 1 2

导航

统计信息