会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
人人从众
我想通过自己的努力而让世界有所不同
博客园
首页
新随笔
订阅
管理
上一页
1
2
3
2021年7月3日
排序指南
摘要: python-排序指南
阅读全文
posted @ 2021-07-03 17:02 人人从众
阅读(56)
评论(0)
推荐(0)
2021年5月25日
Tornado学习笔记1
摘要: Tornado框架基础学习笔记.HelloWorld,留言板.
阅读全文
posted @ 2021-05-25 21:03 人人从众
阅读(54)
评论(0)
推荐(0)
2020年12月16日
HDF5了解和读写操作
摘要: hdf5数据格式了解和python读写操作
阅读全文
posted @ 2020-12-16 23:20 人人从众
阅读(250)
评论(0)
推荐(0)
2019年12月28日
正则表达式相关学习
只有注册用户登录后才能阅读该文。
阅读全文
posted @ 2019-12-28 22:03 人人从众
阅读(2)
评论(0)
推荐(0)
2019年7月10日
统计设计
只有注册用户登录后才能阅读该文。
阅读全文
posted @ 2019-07-10 23:12 人人从众
阅读(4)
评论(0)
推荐(0)
2017年7月1日
MapReduce案例-自定义数据类型
摘要: 统计第一季度用户的手机上网流量,通话时间,短信数量。 数据格式: 电话 流量 时间 短信数 这里自定义了一个类实现writable接口,用来读取数据。
阅读全文
posted @ 2017-07-01 13:42 人人从众
阅读(118)
评论(0)
推荐(0)
Shuffle
摘要: huffle是MapReduce中一个重要的阶段,前几天在面试的时候被问到了。其实我不是一个很会表述理论和原理的人,所以吃了很多亏。这里对shuffle做一个晓得总结。 Map阶段的输出,会经过shuffle过程,然后交给reduce处理。在MapReduce中,为了让Reduce可以并行处理map
阅读全文
posted @ 2017-07-01 12:59 人人从众
阅读(51)
评论(0)
推荐(0)
毕业后的短期计划
该文被密码保护。
阅读全文
posted @ 2017-07-01 12:45 人人从众
阅读(1)
评论(0)
推荐(0)
MapReduce程序的优化
摘要: MapReduce程序的优化主要集中在两个方面:一个是运算性能方面的优化;另一个是IO操作方面的优化。 具体体现在以下的几个环节之上: 1. 任务调度 a. 尽量选择空闲节点进行计算 b. 尽量把任务分配给InputSplit所在机器 2. 数据预处理与InputSplit的大小 尽量处理少量的大数
阅读全文
posted @ 2017-07-01 12:24 人人从众
阅读(59)
评论(0)
推荐(0)
上一页
1
2
3
公告